Cristea, IoniŃă, Pistol – InteligenŃa Artificială 1 Cuvânt înainte Acest curs se adresează studenŃilor FacultăŃii de Informatică din Universitatea “Alexandru Ioan Cuza” din Iasi El grupează materiale pe care primul autor le-a predat în cadrul cursului de InteligenŃă Artificială de-a lungul mai multor ani, dar si capitole noi, contribuite de ceilalŃi doi autori foarte recent Un curs cu acest nume a fost introdus în facultatea noastră în anul 1989, desi anumite module care Ńin de această disciplină fuseseră predate cu mult timp înainte: astfel prof Costică Cazacu preda de mult timp logica rezolutivă a lui Robinson iar prof Călin Ignat preda la acea dată limbajul Prolog De la an la an acest curs s-a modificat (poate nu întotdeauna către mai bine), pe de o parte datorită nestatorniciei domeniului, iar pe de o altă parte, pentru că unui profesor îi e imposibil să repete aceleasi lucruri în doi ani succesivi Idei vehiculate la cursuri si notate grăbit, însemnări făcute la seminar, copii după cursuri luate de mână de studenŃi si cerute lor după ore, toate acestea s-au adunat si au format, în timp, un material semnificativ Doar de câŃiva ani am hotărât să culeg aceste materiale în format electronic, întârzâiere care a fost datorată în mare parte descurajării mele în faŃa imensităŃii materialelor publicate în acest domeniu Dar dacă cedezi în faŃa gândului că orice ai scrie, cineva trebuie să mai fi spus acel lucru altundeva, anii trec, studenŃii vin si pleacă si nimic nu prinde contur si nu rămâne La un moment dat, totusi, trebuie să lasi în urma ta o carte Chiar si atunci când domeniul predat nu coincide cu cel în care îŃi duci activitatea de cercetare, adică cel în care inventezi, încă poŃi fi scuzat să scrii o carte asupra unui domeniu pe care îl cunosti (desigur, parŃial) dacă maniera în care îl descrii îŃi aparŃine si dacă, adoptând-o în predare, studenŃii participă, se implică si se simt bine Predarea nu-si are rost decât atunci când este înŃeleasă ca un act de creaŃie Desi un violonist nu scrie partitura pe care o execută, felul în care interpretează textul muzical îl transformă într-un creator sau, dimpotrivă, îl arată ca fiind un reproducător de duzină Cartea de faŃă, poate la fel ca multe altele, cu siguranŃă n-ar fi existat sau ar fi fost mult mai subŃire dacă as fi Ńinut ca toate ideile redate în ea să fi fost inventate de noi, cei trei autori Cele mai frumoase dintre ideile pe care le-am descris aici au fost inventate de alŃii, noi nefiind decât interpreŃii lor, e drept, în propriul nostru stil Mai toate exemplele însă, cu câteva excepŃii (cazuri în care am menŃionat sursele), sunt originale Cele mai multe dintre ele nu au anvergura unor aplicaŃii reale ci sunt circumscrise tipului “probleme jucărie”, atât de mult agreate în didactica acestui domeniu Câteva sunt decupate însă din aplicaŃii reale si diminuate până la “jucărioare” usor de explicat si formalizat În toŃi acesti ani de când predau acest curs la Facultate, am avut bucuria să lucrez cu mai mulŃi tineri care m-au ajutat la catedră ca asistenŃi Fiecare dintre ei a lăsat urme asupra generaŃiilor de studenŃi si, în diverse moduri, probabil, si asupra acestei cărŃi Ei sunt: Andrei Adrian, Amalia Todirascu, Adrian Iftene, Petrică Obreja, precum si colaboratorii mei actuali, co-autorii, Mădălina IoniŃă si IonuŃ Pistol Le mulŃumesc tuturor, după cum le mulŃumesc acelor studenŃi ai mei care mi-au făcut bucuria să-i reîntâlnesc, la fiecare curs, atenŃi si deschisi să primească noi provocări Capitolele din carte au fost contribuite după cum urmează: capitolele 1-4 – primul autor, capitolul 5 – al doilea autor, capitolul 6 – al treilea autor Dan Cristea Cristea, IoniŃă, Pistol – InteligenŃa Artificială 2 Cuprins 1 Introducere 5 1 1 DefiniŃia InteligenŃei Artificiale si un pic de istorie 5 1 2 Testul Turing 5 1 3 Probleme de natură filosofică si pragmatică 6 1 4 Subdomenii ale inteligenŃei artificiale 8 1 5 Probleme si soluŃii IA faŃă de probleme si soluŃii de programare clasică 11 1 5 1 Prin ce diferă o problemă clasică de una de IA ? 11 Bibliografie 12 2 LISP 13 2 1 Introducere 13 2 2 FuncŃii, maniere de definire si apel 15 2 2 1 TransparenŃa referenŃială 15 2 2 2 Efectul lateral 15 2 2 3 De la notaŃia lambda la Lisp pur 16 2 2 4 Evaluarea numerică faŃă de evaluarea simbolică 17 2 2 5 Beneficiile unui Lisp impur: Common Lisp 17 2 3 Tipuri de date în Lisp 17 2 3 1 ConstrucŃiile limbajului 18 2 3 2 Un pic de sintaxă 18 2 3 2 Liste si reprezentarea lor prin celule cons 21 2 3 3 Perechi si liste cu punct 22 2 3 4 Evaluarea expresiilor 22 2 4 FuncŃii si forme Lisp 24 2 4 1 NotaŃii 24 2 4 2 Asignarea unei valori unui simbol 26 2 4 3 FuncŃii pentru controlul evaluării 27 2 4 4 OperaŃii asupra listelor 27 2 4 5 OperaŃii cu numere 29 2 4 6 Predicate 33 2 4 7 Liste privite ca mulŃimi 36 2 4 8 OperaŃii logice si evaluări controlate 37 2 4 9 Forme pentru controlul evaluării 38 2 4 10 Liste si tabele de asociaŃie 39 2 4 11 LocaŃii si accese la locaŃii 41 2 4 12 Lista de proprietăŃi a unui simbol 41 2 4 13 FuncŃii chirurgicale 42 2 4 14 Forme de apelare a altor funcŃii 44 2 4 15 Lambda expresii 44 2 4 16 Lambda-funcŃii recursive 45 2 4 17 FuncŃii de corespondenŃă 45 2 5 Tehnici de programare în Lisp 48 2 5 1 DefiniŃii de funcŃii 48 2 5 2 Recursivitate 48 Recursivitate coadă 50 Scrierea funcŃiilor cu recursivitate coadă prin parametru acumulator 50 2 5 3 Forme de secvenŃiere 51 2 5 4 Formele speciale let si let* 51 2 5 5 Variabile si domeniile lor 53 2 5 6 Legări versus asignări 55 2 5 7 Forme de iterare 56 2 5 8 Valori multiple si exploatarea lor 58 2 5 9 Închideri 59 2 5 10 Transferul argumentelor în funcŃii 60 2 6 Macro-uri 62 2 6 1 DefiniŃie, macroexpandare si evaluare 62 2 6 2 Despre apostroful-stânga (backquote) 63 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 3 2 6 3 Asupra manierei de construcŃie a macro-urilor 64 2 6 4 Cum se testează macro-expandările? 66 2 6 5 Asupra destructurizării 66 2 6 6 Când să folosim macro-uri? 67 2 6 7 Argumente pro si contra utilizării macro-urilor 67 2 7 Un exemplu de program care se modifică în timpul rulării 68 Bibliografie 70 3 Căutare Rezolvarea problemelor Sisteme de producŃie 72 3 1 Formalizarea problemelor de IA 72 3 1 1 Problemă, instanŃă de problemă, spaŃiul stărilor 72 3 1 2 Recunoasterea stărilor 74 3 1 3 Reprezentarea stărilor 76 3 1 4 Reprezentarea tranziŃiilor între stări 76 3 1 5 Căutarea soluŃiei 78 3 2 Exemple de formalizări 80 3 2 1 MaimuŃa si banana 80 3 2 2 Lumea cuburilor (blocurilor) 84 3 3 Controlul sistemelor de producŃie 89 3 3 1 Strategii irevocabile 89 3 3 2 Strategii tentative 94 3 4 Sisteme Expert 108 3 4 1 Tipuri de căutări 108 3 4 2 Sistemele Expert (SE) 109 3 5 Concluzie 109 Bibliografie 113 4 Reprezentarea cunoasterii si raŃionament 115 4 1 Ontologii 116 4 2 Taxonomii 117 4 3 Paternitate versus monotonie în sisteme ierarhice 118 4 3 1 SoluŃii în cazul mostenirilor contradictorii 120 4 4 ReŃelele semantice descriptive – sisteme ierarhice nemonotone 120 4 4 1 Un exemplu de reprezentare 120 4 4 2 Interogări în reŃele semantice 123 4 4 3 Demoni 127 4 4 4 AmbiguităŃi în reprezentarea prin reŃele semantice 130 4 5 ReŃele semantice evenimenŃiale InferenŃe 131 4 5 1 Evenimente aflate în corelaŃie logică 133 4 5 2 Un model inferenŃial 134 Bibliografie 144 5 Probleme de satisfacere a constrângerilor 146 5 1 Introducere 146 5 2 Backtracking în satisfacerea constrângerilor 149 5 2 1 Backjumping 150 5 2 2 Forward-checking 152 5 3 InferenŃa 154 5 3 1 Arc-consistenŃă 155 5 3 2 Bucket-Elimination 157 5 4 Euristici pentru selectarea variabilelor si a valorilor 160 5 4 1 Ordonarea variabilelor 160 5 4 2 Selectarea valorilor 161 5 5 Metode stochastice 162 5 6 Concluzii 162 Probleme 163 Bibliografie 164 6 ÎnvăŃarea automată 166 6 1 Descriere generală 166 6 2 Caracteristici ale unui sistem capabil de învăŃare 167 6 2 1 Scopul metodei si baza de cunostinŃe necesară 167 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 4 6 2 2 Formalismul de reprezentare a datelor utilizate si a celor învăŃate 167 6 2 3 Setul de operaŃii 168 6 2 4 SpaŃiul general al problemei 169 6 2 5 Reguli euristice pentru căutare 169 6 3 ÎnvăŃarea supervizată 169 6 3 1 Concepte invăŃabile PAC 169 6 3 2 Arbori de decizie 170 6 3 3 Calculul câstigului de informaŃie 172 6 3 4 Probleme în utilizarea arborilor de decizie 174 6 3 5 Inducerea sabloanelor logice 175 6 3 6 ÎnvăŃarea Bayesiană 177 6 3 7 ÎnvăŃarea prin încurajare 177 6 3 8 ÎnvăŃarea pasivă într-un domeniu cunoscut de stări 178 6 3 9 ÎnvăŃarea pasivă într-un domeniu necunoscut de stări 179 6 3 10 ÎnvăŃarea activă 179 6 3 11 Algoritmii genetici 180 6 3 12 ÎnvăŃarea bazată pe cunostinŃe 180 6 3 13 ÎnvăŃarea bazată pe explicaŃii 181 6 3 14 ÎnvăŃarea bazată pe relevanŃă 182 6 3 15 ÎnvăŃarea inductivă bazată pe cunostinŃe 182 6 3 16 Dezavantajele învăŃării supervizate 183 6 4 ÎnvăŃarea nesupervizată 184 6 4 1 Identificarea claselor de instanŃe 184 6 4 2 Structura cunostinŃelor taxonomice 186 6 5 Concluzii 188 Bibliografie 191 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 5 Capitolul 1 Introducere Când un venerabil si respectat om de stiinŃă spune că un lucru este posibil, sigur are dreptate Când un venerabil si respectat om de stiinŃă spune că un lucru este imposibil, sigur se înseală Arthur C Clarke 1 1 DefiniŃia InteligenŃei Artificiale si un pic de istorie Luată din DicŃionarul Explicativ al Limbii Române (DEX), definiŃia inteligenŃei pune în evidenŃă capacitatea individului de a se adapta si de a rezolva situaŃii noi pe baza experienŃei acumulate anterior IntuiŃia lexicografului a devansat cercetările de IA – care doar recent au pus pe primul plan cunoasterea, deplasând centrul de greutate al definiŃiei IA către cunoasterea aplicată DefiniŃia InteligenŃei Artificiale este dată de Barr&Feigenbaum (Barr, Feigenbaum, 1981): IA este stiinŃa, parte a informaticii, care proiectează sisteme artificiale cu comportament inteligent – adică sisteme ce manifestă proprietăŃi pe care în mod obisnuit le asociem cu existenŃa inteligenŃei în comportamentul uman - înŃelegerea limbajului, învăŃare, raŃionament, rezolvarea problemelor s a m d Astfel de sisteme pot răspunde flexibil în situaŃii ce nu au fost anticipate de programator Precursor al domeniului este considerat Norbert Wiener, care, bazat pe tripla formaŃie universitară în matematică, zoologie si filosofie, reuseste să găsească în cartea sa Cibernetica sau control si comunicaŃie la om si masină Sintagma InteligenŃă Artificială este pronunŃată însă pentru prima oară în 1956 la conferinŃa de la Darthmouth, Canada 1 2 Testul Turing Introducerea unui arbitru uman într-o dispută având ca scop definirea inteligenŃei masinii pare inevitabilă DificultăŃi de natură filosofică fac imposibilă găsirea unei definiŃii riguroase a inteligenŃei Odată ce acceptăm un amestec uman în această dispută înseamnă că cedăm empiricului, partizanului, subiectivului, adică în fapt recunoastem imposibilitatea de standardizare într-o chestiune care n-ar fi existat dacă noi n-am fi existat Suntem capabili a marca inteligenŃa umană pe o scară Q, dar cum putem face distincŃia dintre inteligenŃa umană si cea a masinii? În testul Turing un subiect uman si o masină sunt asezate în camere distincte de aceea a unui alt personaj uman, numit arbitru Arbitrul comunică cu subiectul uman si cu masina prin intermediul unei tastaturi si trebuie, prin întrebări adresate celor doi, să decidă care din ei e omul si care e masina În dilema identificării inteligenŃei într-o masină, vom constata că manifestăm întotdeauna o reŃinere în a considera că o masină e înzestrată cu inteligenŃă, chiar dacă răspunsurile ei sunt cele pe care le asteptăm de la un interlocutor uman, pentru că vom fi nesiguri dacă interfaŃa spectaculoasă este susŃinută de o trăire psihică adecvată ori este doar o simulare Un obstacol serios în definirea gradului în Cristea, IoniŃă, Pistol – InteligenŃa Artificială 6 care o masină poate fi considerată inteligentă, va rămâne diferenŃa dintre comportament, ce poate fi obiectivat, si acel ceva adânc, personal si indefinibil care provoacă comportamentul Plasată în condiŃii de test diverse, până la urmă inteligenŃa poate fi decantată de fals Apoi IA este un domeniu foarte adânc ancorat într-o realitate pragmatică Ceea ce interesează în fapt este ca masina să fie capabilă să înlocuiască niste sarcini care în mod normal presupuneau prezenŃa omului Aceste sarcini sunt adesea foarte bine precizate de un cadru al aplicaŃiei si, deocamdată, nu se cere masinii un comportament universal inteligent 1 3 Probleme de natură filosofică si pragmatică Testul Turing – pentru prima oară publicat în revista Mind, în 1950 Există o competiŃie anuală (http://www cogsci ucsd edu/~asaygin/tt/ttest html) Dificultatea principală constă în încorporarea cunoasterii de bun-simŃ (common-sense knowledge) în masină Dar testul Turing este contestat de anumiŃi teoreticieni ai domeniului ca fiind relevant pentru a defini inteligenŃa masinii Ei argumentează că o masină care ar trece acest test nu ar manifesta inteligenŃă în aceeasi manieră în care un om ar manifesta-o Testul Turing nu dă decât o privire superficială asupra inteligenŃei, utilizând un criteriu distinctiv pur pragmatic, pe când adevărata inteligenŃă e de natură adânc semantică O masină care ar trece testul Turing se spune că ar manifesta inteligenŃă artificială slabă (weak AI) Penrose (Penrose, 1998) nu crede că inteligenŃă adevărată poate fi cu adevărat prezentă fără constiinŃă si de aici că inteligenŃa nu va putea fi niciodată produsă de nici un algoritm ce e executat pe o masină El enunŃă patru puncte de vedere ce pot fi identificate relativ la problema realizării inteligenŃei pe o masină Punctul de vedere mecanicist, sau al inteligenŃei artificiale tari, confundă gândirea cu calculul Mai mult decât gândirea, ca manifestare logică a unui creier, toate trăirile care implică constiinŃa reprezintă rezultate ale unor calcule La una din extremele acestui punct de vedere întregul univers e privit ca un imens calculator, mintea omenească reprezentând doar una din componentele acestui proces de calcul Faptul că însăsi substanŃa pare a se raporta din punct de vedere computaŃional la energie (conform formulei lui Einstein E=mc2) întăreste acest punct de vedere după care fenomenele ce se desfăsoară în celulele creierului pot fi gândite matematic, deci simulate pe un alt mediu computaŃional decât cel original Cum toate manifestările interne ale unui creier ar putea fi reproduse pe o masină care efectuează calcule, atunci ar trebui să acceptăm că până si manifestările interne – constiinŃa însăsi – ar putea fi redate pe o masină În esenŃă dispare diferenŃa dintre constiinŃă si simularea ei, tot ceea ce se poate petrece pe o masină performantă este adevăr în aceeasi măsură în care adevăr reprezintă trăirile noastre adânci, sentimentele, bucuriile si durerile noastre, ideile pe care le avem ori înŃelegerea pe care credem că o avem faŃă de o operă de artă sau o bucată muzicală În conformitate cu acest punct de vedere testul Turing este absolut relevant în depistarea inteligenŃei artificiale, dacă o masină răspunde adecvat la întrebări înseamnă că si înŃelege acele întrebări si răspunsurile ei sunt în rezonanŃă cu procese mentale de profunzime pe care aceste întrebări le inspiră Cristea, IoniŃă, Pistol – InteligenŃa Artificială 7 Punctul de vedere al inteligenŃei artificiale slabe acceptă din nou constiinŃa ca rezultat al acŃiunilor fizice ale creierului si faptul că orice acŃiune fizică poate fi reprodusă computaŃional, dar simularea computaŃională nu trezeste sau nu presupune si constiinŃă Spre deosebire de punctul de vedere mecanicist un robot care trece testul Turing în mare măsură simulează înŃelegerea fără ca aceasta să aibă cu adevărat loc, la nivelul reacŃiilor o persoană si o masină se manifestă la fel, dar masina simulează constiinŃa, o raportează doar, pe când o fiinŃă o experimentează Simularea computaŃională a unui proces este un lucru complet diferit de procesul însusi (Searle, 1992) Searle (Searle, 1980) imaginează un experiment capabil să demonstreze că un calculator nu are aceeasi înŃelegere ca un om: conceptul de cameră chinezească În acest experiment se presupune existenŃa unui calculator supersofisticat capabil să „înŃeleagă” (în orice accepŃiune posibilă a acestui termen) un text în chineză si să răspundă la întrebări legate de acesta Textul si apoi întrebările sunt prezentate masinii ca siruri de caractere chinezesti pe cartonase, iar răspunsurile acesteia sunt tipărite si prezentate în aceeasi manieră În faza a doua a imaginarului experiment, intervine un individ superdotat, programator, care nu stie o iotă chinezeste Lui i se prezintă programul masinii si i se cere să-l aplice pentru a obŃine, el însusi, acelasi rezultat După mai mult timp, în care acesta desluseste programul masinii, el va fi capabil să obŃină aceleasi rezultate ca si masina Problema este asadar următoarea: faptul că individul uman este acum capabil să răspundă corect unor întrebări puse într-o limbă pe care el nu o vorbeste, relative la un text prezentat în aceeasi limbă, ne poate face să spunem că el „a înŃeles” acel text si acele întrebări? E posibil să credem că atât masina cît si individul din experimentul lui Searle ar fi trecut testul Turing (în sensul că, plasat în locul calculatorului si deci întrecându-se cu un individ care stie chinezeste, arbitrul nu l-ar fi putut demasca) Si totusi accepŃiunea lui „a înŃelege chinezeste” este evident una particulară aici În enunŃul experimentului său Searle reduce problematica la prelucrări dibace de siruri de caractere chinezesti Dintr-un anumit punct de vedere, care se concentrează strict asupra unei perechi de cartonase intrare-iesire, întradevăr avem de a face cu prelucrări de caractere Constient sau nu, în formularea experimentului camerei chinezesti Searle nu insistă asupra faptului că pentru a obŃine performanŃele de prelucrare descrise programul trebuie să se ridice de la date prezentate sub formă de siruri de caractere la concepte Doar transformarea sirului de caractere chinezesti din intrare în concepte (care sunt independente de o limbă sau alta), urmat de capacitatea de a opera cu acestea si de a transpune din nou conceptele în siruri de caractere prezentate în iesire, ar fi putut face posibilă obŃinerea unui rezultat de acest fel Numai că această ridicare de la nivelul de prelucrare al sirurilor de caractere la cel al unei prelucrări de tip conceptual nu schimbă cu nimic concluzia Pentru că în definitiv si conceptele pot fi etichetate cu siruri de caractere Punctul de vedere realist (îmbrăŃisat de Penrose, ca si de mine) nu acceptă nici măcar posibilitatea unei reproduceri realiste a constiinŃei Mai devreme sau mai târziu, dacă dialogul continuă, masina trebuie să se dea de gol Efectele externe ale constiinŃei nu pot fi simulate corespunzător Există manifestări ale constiinŃei care nu pot fi explicate prin legile actualmente cunoscute ale fizicii si, ca urmare, nu pot fi reproduse computaŃional Nu este nici un fel de fetisism în acest punct de vedere Pentru mai multe detalii cititorul este îndemnat să consulte cartea lui Penrose Cristea, IoniŃă, Pistol – InteligenŃa Artificială 8 În sfârsit, punctul de vedere mistic este cel conform căruia constiinŃa nu poate fi explicată în termeni fizici, stiinŃa e neputincioasă în tentativa de a explica constiinŃa Cu toată aparenta identitate dintre aceste două ultime puncte de vedere, există totusi o mare diferenŃă între ele: ultimul neagă a-priori capacitatea stiinŃei de a cunoaste constiinŃa, pe când cel realist afirmă că problema constiinŃei constiente este una stiinŃifică si doar incapacitatea noastră momentană nu ne permite să o pătrundem deplin În ciuda dificultăŃilor de a identifica inteligenŃa artificială cu cea naturală, există puternice motivaŃii de natură pragmatică pentru realizarea de sisteme cu comportament inteligent sau apropiat de cel inteligent Asadar, mai puŃin aplecat asupra detaliilor demonstraŃiilor filosofice, domeniul IA este complet absorbit de practică Acest lucru se observă cu predilecŃie în apelul la proiecte de cercetare în domeniul tehnologiei informaŃiei (Information and Science Technology - IST) din cadrul programului cadru 6 (framework program 6 – FP6) al Comisiei Europene, lansat în decembrie 2002 (v situl web http://www cordis lu) 1 4 Subdomenii ale inteligenŃei artificiale Prelucrările simbolice (symbolic processing) reprezintă componenta cu preocupări de programare a domeniului Ea a dus la dezvoltarea unor limbaje specializate în prelucrarea simbolurilor, cel mai cunoscut dintre ele fiind Lisp Fără a neglija aspectele clasice ale programării, cum ar fi utilizarea numerelor în calcule, în toate aceste limbaje se pune un accent deosebit pe manipularea simbolurilor Un limbaj adecvat prelucrărilor simbolice găzduieste cu usurinŃă reprezentarea si manipularea simbolurilor de orice natură, nu numai numerice Pentru că inteligenŃa artificială se bazează în mare măsură pe manipularea simbolurilor, Lisp este considerat limbajul de casă (sau nativ) al inteligenŃei artificiale Un tip particular de prelucrări simbolice sunt confruntările de sabloane (pattern matching) Sabloanele sunt obiecte abstracte formate din părŃi definite riguros si altele doar schiŃate Sabloanele sunt utilizate pentru regăsirea de obiecte ce satisfac anumite constrângeri în mulŃimi de obiecte asemănătoare Procesare simbolică si limbaje de procesare simbolică În general se acceptă că sistemele inteligente din natură prelucrează două tipuri de informaŃii: de natură simbolică sau concentrată si de natură difuză, distribuită Calculatoarele noastre, prin proiectare, sunt destinate a manipula numere si caractere, având compartimente special proiectate pentru realizarea performantă de calcule numerice Lucrul cu simboluri (siruri de caractere, imagini sau sunete) desi realizabil pe calculatoarele clasice, necesită tehnici speciale mulate pe natura digitală a aparatului de calcul Masina uzuală pe care o avem la dispoziŃie nu are cablate disponibilităŃi de a opera cu simboluri, de a realiza regăsiri simbolice pe bază de asociaŃii, ori de a forma alŃi simboluri prin compunere Manipularea simbolurilor necesită un aparat logic si un suport adecvat de calcul (o masinărie) Aparatul logic este dat de logica simbolică care reprezintă atît un model de formalizare a cunostinŃelor cît si o metodă de raŃionament Masinăria este asigurată de limbajele de procesare simbolică capabile a simula un comportament adecvat prelucrărilor simbolice mulat pe natura slab simbolică a masinii Dintre acestea, putem identifica: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 9 Lisp – în paradigma funcŃională, Prolog – în paradigma logică si Clips – în paradigma bazată pe reguli1 Reprezentarea cunoasterii (knowledge representation) Putem interacŃiona cu mediul înconjurător pentru că, pe de o parte, datorită simŃurilor, intrăm în legătură cu ea, iar pe de altă parte o "înŃelegem" asa cum este Ca sa înŃelegem realitatea avem însă nevoie de a o "proiecta" în mintea noastră Această proiecŃie este o reprezentare a realităŃii Fără a avea o reprezentare asupra unei entităŃi nu putem emite judecăŃi asupra ei Reprezentarea implică, în principiu, trei componente: o notaŃie, o denotaŃie si un calcul NotaŃia este un desen, sau o structură de date, care respectă anumite convenŃii (date de obicei de o sintaxă) ConotaŃia, sau semantica, este interpretarea pe care o dăm notaŃiei, din nou pe baza unui sistem de convenŃii Fără aceste reguli de interpretare notaŃia este superfluă În sfârsit o reprezentare trebuie să includă un model computaŃional care să facă posibilă operarea cu obiectele si relaŃiile dintre obiecte ce compun reprezentarea Datorită modelului de calcul entităŃile modelate prind viaŃă, putându-se studia astfel comportamentul lor în condiŃii ce simulează de aproape realitatea RaŃionament automat si demonstrarea teoremelor (theorem proving, problem solving) Cea mai veche ramură a IA si cea mai teoretică dintre ele, utilizează logica ca sistem formal de găsire a demonstraŃiilor si de generare a inferenŃelor automate Foarte multe probleme pot fi formalizate ca probleme de matematică sau logică, rezolvarea lor reducându-se la o demonstrare a unei teoreme plecând de la un sistem de axiome si utilizând un mecanism de deducŃie logică Ca si în alte cazuri, dificultăŃile rezidă în numărul extrem de mare de posibilităŃi ce pot apare Pentru controlul exploziei de posibilităŃi în căutarea unei soluŃii se utilizează de multe ori soluŃii euristice, care desi nu garantează soluŃia optimă, pot în general duce la găsirea uneia, cel puŃin ÎnŃelegerea limbajului natural (natural language processing) Este de mult acceptat că utilizarea limbajului este o caracteristică definitorie a inteligenŃei Desi nouă ne vine atât de usor să comunicăm prin limbaj, o încercare de explicitare a mecanismelor care stau la baza înŃelegerii textelor ori a limbajului vorbit se dovedeste deosebit de dificilă În domeniul înŃelegerii limbajului natural trebuie întîi stabilită o distincŃie între a înŃelege un mesaj comunicat prin voce si a înŃelege un mesaj scris De prima chestiune se ocupă domeniul de cercetare al interpretării vorbirii (speech processing) Problema înŃelegerii limbajului – în varianta scrisă – face obiectul a două tipuri de preocupări Lingvistica computaŃională pe de o parte, ca domeniu pur academic, pune în discuŃie modele computaŃionale ale limbajului natural cu scopul de a investiga si descoperi natura însusi a limbajului si a abilităŃilor cognitive umane Ingineria Lingvistică (sau în varianta predominant americană, Tehnologia Limbajului Uman), pe de altă parte, este preocupată de a dezvolta 1 Paradigmele de programare sunt stiluri ori precepte generale de programare transpuse în caracteristicile unor limbaje Astfel în cadrul paradigmei imperative se clasifică limbajele bazate pe comenzi, paradigma funcŃională pune la baza programării noŃiunea matematică de funcŃie ideea de bază fiind că un program înseamnă un apel de funcŃie, paradigma orientată obiect aduce în prim plan noŃiunea de obiect înzestrat cu proprietăŃi si metode, paradigma logică realizează un program ca o demonstraŃie de teoremă, în paradigma bazată pe reguli un program reprezintă o colecŃie de reguli si un motor aplică aceste reguli într-o anumită ordine Cristea, IoniŃă, Pistol – InteligenŃa Artificială 10 aplicaŃii care se bazează pe utilizarea limbajului natural, orientate spre industrie, comerŃ, sfera socialului sau cea educaŃională2 Vederea artificială (vision) Cinci simŃuri3 (vederea, auzul, simŃul tactil, mirosul si gustul) ne stau la dispoziŃie pentru a interacŃiona cu mediul, pentru a lua cunostinŃă de ceea ce se află în afara corpului nostru, în imediata noastră vecinătate Pentru a ne prelungi "bătaia" acestor simŃuri am inventat aparate care ne ajută să vedem ori să auzim la distanŃă Modelarea acestor simŃuri pe sisteme automate reprezintă cu certitudine, o preocupare de mare însemnătate a domeniului IA Dintre cele cinci, vederea ocupă un loc privilegiat Sistemele de vedere artificială încearcă să descifreze mecanismele vederii si ale interpretării imaginilor statice si în miscare Planificare si robotică (robotics) Sistemele inteligente vii au abilitatea de a găsi soluŃii de deplasare în spaŃiu în vederea atingerii unor obiective sau de mutare a unor obiecte folosind braŃele Căutarea unui drum pe un teren accidentat (lunar, de exemplu, sau pe fundul oceanelor) sau într-un spaŃiu presărat cu obstacole (cum este o cameră) nu este o problemă simplă, nu în ultimul rând datorită numărului mare de posibilităŃi de alegere la fiecare pas, complexitate ce face imposibilă tentativa căutării exhaustive Încercând a modela procesele cognitive care se desfăsoară în sistemele vii, planificarea roboŃilor este un câmp de cercetare care urmăreste a îmbunătăŃi comportamentul roboŃilor atunci când ei sunt programaŃi a executa diferite sarcini ÎnvăŃare automată (learning) Un sistem înzestrat cu inteligenŃă este capabil să înveŃe pentru a-si îmbunătăŃi interacŃiunea cu mediul El poate învăŃa fie din greseli, prin auto-perfecŃionare, fie ghidat de un profesor, fie generalizând, fie prin analogie, sau din exemple pozitive si negative Domeniul învăŃării automate formalizează aceste metode si caută aplicarea lor la sistemele automate Sisteme expert (expert systems) Puterea stă în cunoastere Aplicarea acestui truism în sisteme artificiale înseamnă dotarea lor cu abilitatea de a se servi de cunoastere specifică (cunoastere expert) Un medic este bun în găsirea unui diagnostic pentru că are un bagaj de cunostinŃe generale dar si specifice despre boli si bolnavi ParŃial această cunoastere a deprins-o din cărŃi, parŃial în cursul anilor de experienŃă clinică, prin atâtea cazuri în care s-a implicat AchiziŃionarea, formalizarea si includerea cunoasterii expert în sistemele artificiale reprezintă scopul domeniului Sistemelor Expert Cursul nostru va dezbate cu precădere probleme de această natură 2 DefiniŃiile sunt preluate dintr-un recent mesaj difuzat pe lista corpora@hd uib no de Prof Geoffrey Sampson, School of Cognitive & Computing Sciences, University of Sussex, care la rândul său citează un articol publicat într-un număr recent al revistei Natural Language Engineering 3 Cercetări noi lasă speranŃa că vom învăŃa să ne servim de încă alte simŃuri din sfera para-normalului, ce la majoritatea dintre noi sunt de utilitate subliminală, dar pentru care alŃii manifestă o dotare aparte Cristea, IoniŃă, Pistol – InteligenŃa Artificială 11 1 5 Probleme si soluŃii IA faŃă de probleme si soluŃii de programare clasică 1 5 1 Prin ce diferă o problemă clasică de una de IA ? Există o seamă de trăsături care diferenŃiază câmpul IA de alte domenii ale informaticii (computer science) Cursul de faŃă încearcă să convingă cititorul că măcar următoarele trăsături pot fi considerate definitorii: • Ce face ca o problemă să fie considerată de IA, iar o alta nu? - problemele de IA necesită în general un raŃionament predominant simbolic; - probleme care îmbie la investigaŃii IA sunt si cele care manipulează informaŃie incompletă ori nesigură; • Ce face ca o soluŃie să fie considerată ca fiind caracteristică metodelor IA? - de cele mai multe ori nu este de natură algoritmică Adesea, ea este obŃinută în urma unei căutări într-un spaŃiu al soluŃiilor posibile; - soluŃiile ce se cer nu trebuie cu necesitate să fie cele mai bune sau exacte Uneori e suficient dacă o soluŃie este găsită, sau dacă o formulare aproximativă a ei este obŃinută; - în rezolvarea problemelor de IA adesea intervin cantităŃi foarte mari de informaŃii specifice Găsirea unui diagnostic medical nu poate fi algoritmizat pentru că diferenŃele de date asupra pacientului incumbă tipuri însusi de soluŃii diferite De aceea doctorii spun că nu există boli si doar pacienŃi; - natura cunoasterii ce se manipulează în problemele de IA poate fi usor departajată în procedurală si declarativă: este diferenŃa dintre cunoasterea pe care o posedă cu păianjen si un inginer constructor de poduri, sau diferenŃa dintre cunoasterea pe care o posedă un jucător de tenis si un bun antrenor Cunoasterea unuia se află ‘în vârful degetelor’, a celuilalt într-un sistem de reguli • Pot probleme de IA fi rezolvate prin algoritmi clasici ? - Cu siguranŃă că da, dar soluŃiile vor fi probabil greoaie, greu generalizabile, nefiresti si neelegante • Invers: pot probleme clasice fi rezolvate prin metode ale IA ? - Iarăsi lucrul este posibil, dar e ca si cum am folosi un strung ca să ascuŃim un creion De ce un program de calcul al salariilor nu este un program de IA pe când a face un robot să măture prin casă fără a distruge mobila, sau a face un program să recunoască figuri umane este o aplicaŃie de IA? DistincŃia dintre cunoasterea procedurală si cea declarativă Trăsături ale cunoasterii declarative: • poate fi schimbată mai rapid si mai usor pentru că este de natură discretă; • poate fi folosită la mai multe scopuri decât la cel imaginat iniŃial; Cristea, IoniŃă, Pistol – InteligenŃa Artificială 12 • poate fi extinsă prin procese de raŃionament care adaugă cunoastere nouă; • poate fi accesată de programe de introspecŃie care să ofere explicaŃii la cerere Nivelul actual al cercetărilor si realizărilor în IA Exemple de direcŃii de cercetare particulare în IA:  sisteme inteligente pentru biologie moleculară (până în 1997 – s-au Ńinut 5 conferinŃe internaŃionale pe această temă, începând din 93);  roboŃi inteligenŃi – competiŃii de roboŃi inteligenŃi (primul Ńinut la San Jose, California, în 1992, în 1996 –a 5-a ediŃie, în Portland, Oregon) • sisteme expert (medicină, chimie, geologie, configurarea sistemelor de calcul, descoperirea legilor fizicii); • raŃionament automat, demonstrarea de teoreme; • verificarea programelor; • matematică simbolică (calcul diferenŃial, integral, manipularea expresiilor); • jocuri (sah, table, checkers) • interfeŃe în limbaj natural la baze de date si de cunostinŃe; • sisteme de întrebare-răspuns pe domenii limitate sau largi; • sisteme de traducere automată; • senzori inteligenŃi; • controlul roboŃilor staŃionari si mobili (linii de asamblare, roboŃi subacvatici sau spaŃiali) CerinŃe pentru studenŃi • Să cunoască semnificaŃia si detaliile testului Turing • Să cunoască definiŃia domeniului IA si cu ce se ocupă subdomeniile sale • Să poată distinge o problemă de IA de una clasică Bibliografie Barr, A , Feigenbaum, E 1981 The handbook of Artificial Intelligence William Kaufmann, Inc Se poate consulta la Biblioteca Seminarului Matematic de la Facultatea de Matematică a UniversităŃii ”Al I Cuza” Penrose, R 1989 The Emperor's New Mind: Concerning Computers, Minds and the Laws of Physics, Oxford University Press, New York Tradusă în limba română de Cornelia C Rusu si Mircea V Rusu ca "Mintea noastră… cea de toate zilele: Despre gândire, fizică si calculatoare", Ed Tehnică, Bucuresti 1996 Penrose, R 1994 Shadows of the Mind, Oxford University Press Tradusă în limba română de Dana Jalobeanu ca "Incertitudinile raŃiunii (Umbrele minŃii) În căutarea unei teorii stiinŃifice a constiinŃei", Ed Tehnică, Bucuresti, 1999 Searle, J R 1980 Minds, brains and programs În „The behavious and brain sciences”, vol 3, Cambridge University Press Searle, J R 1992 The rediscovery of the mind MIT Press, Cambridge University Press, Massachusetts Cristea, IoniŃă, Pistol – InteligenŃa Artificială 13 Capitolul 2 LISP Mintea funcŃionează ca o parasută: e utilă doar când e deschisă Lord Thomas Dewar 2 1 Introducere IntenŃia acestui capitol nu este aceea de a da o descriere exhaustivă a limbajului LISP ci de a introduce noŃiunile esenŃiale ale lui, care să facă posibilă scrierea de aplicaŃii simple la capitolele de inteligenŃă artificială ce urmează Nu vrem ca prezentarea să urmărească cu necesitate un anumit dialect de Lisp Toate exemplele noastre vor putea însă fi rulate direct în Allegro Common Lisp, versiunea de Common Lisp creată de Franz Inc (www franz com) Common Lisp (Steele, 1990) este dialectul pe care l-a dezvoltat Comisia de standardizare a Lisp-ului X3J13 din cadrul ANSI (American National Standard Institute) Datorită flexibilităŃii deosebite a limbajului, care parcă invită la implementări aventuroase, procesul de standardizare a fost unul de durată, dar după anul 1990 a fost finalizat în varianta care este acceptată astăzi de cele mai multe implementări Common Lisp Lisp – limbajul proiectat special pentru problema pe care o am de rezolvat Dacă ar fi să inventăm o reclamă pentru promovarea limbajului Lisp, ar trebui, probabil, să ne exprimăm astfel: • Lisp este limbajul care găzduieste, cu simplitate si eleganŃă, conceptul de prelucrare a datelor cunoscut sub numele de prelucrare simbolică Fără a neglija calculul numeric, limbajele simbolice au facilităŃi speciale de a lucra cu simboluri nenumerice • Lisp este unul dintre limbajele care exemplifică paradigma de programare funcŃională4 O funcŃie este un obiect matematic care întoarce o unică valoare pentru un set de valori date în intrare Toate construcŃiile unui limbaj funcŃional pur sunt funcŃii care întorc valori atunci când sunt evaluate Lisp, ca si multe dintre suratele lui funcŃionale, a acceptat însă si efecte laterale în evaluarea funcŃiilor, care desi l-au impurificat i-au mărit expresivitatea • Lisp este limbajul care se mulează pe problema pe care o aveŃi de rezolvat Această afirmaŃie trebuie înŃeleasă în sensul ergonomiei excepŃionale pe care o oferă limbajul actului de programare Programarea în Lisp este, pentru un cunoscător, o plăcere, un spectacol si o invitaŃie la creaŃie Programarea în Lisp este usoară iar productivitatea limbajului este remarcabilă Lispul este adesea mai concis decât alte limbaje 4 Alături de Erlang – pentru aplicaŃii concurente, R – pentru prelucrări statistice, Mathematica – pentru matematică simbolică, APL – cunoscut mai ales pentru facilităŃile de a opera cu matrici, extensia ulterioară a acestuia J, K – pentru analiză financiară, XSLT – pentru transformarea documentelor XML, cât si limbajele noi ML (al lui Robin Milner), cât si Miranda (David Turner) si urmasul acestuia Haskell (dezvoltat de Haskell Curry) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 14 • Lisp este limbajul care se dezvoltă pe măsură ce rezolvaŃi problema Această trăsătură provine din utilizarea macrourilor – secvenŃe de cod ce suportă execuŃii specială Prin macrouri se poate da nu numai o nouă interpretare noŃiunii de evaluare a formelor limbajului, ci se poate schimba însăsi sintaxa Se pot crea în acest fel linii de cod care nu mai seamănă deloc cu sintaxa obisnuită a limbajului • Lisp este un limbaj specializat pentru prelucrarea listelor, ceea ce se reflectă în chiar numele lui (LISt Processing) Motivul pentru care lista, o structură de date relativ nespectaculoasă, poate sta la baza unui limbaj dedicat dezvoltării de aplicaŃii într-un domeniu atât de pretenŃios precum inteligenŃa artificială este că această structură este extrem de generală, o listă putând înlănŃui nu numai simboluri precum numere si cuvinte ci si alte liste, oferind posibilitatea reprezentării de o manieră uniformă a unor structuri oricât de complicate • Lisp este limbajul „de casă” al inteligenŃei artificiale Caracteristicile ce-i conferă această calitate sunt: facilitatea de a lucra cu simboluri, lista – ca structură fundamentală de date, mecanismele complexe de evaluare si utilizare a macrourilor, care pot duce la construcŃii procesuale sofisticate si care se comportă diferit în funcŃie de context Lisp facilitează o abordare multi-strat în programare Implementările orientateobiect ale acestui limbaj îi conferă toate trăsăturile cunoscute ale paradigmei În mod particular, programarea multi-strat înseamnă construcŃia de straturi de definiŃii funcŃionale, ceea ce invită la o abordare bottom-up în rezolvarea problemelor, în asa fel încât apelurile de la un nivel superior să incorporeze definiŃii de funcŃii si construcŃii de pe un nivel inferior Programarea multi-strat este cu deosebire o abordare care se pretează dezvoltării proiectelor mari, care necesită lucru în echipă, uneori conlucrarea mai multe echipe Asa cum se sugerează în Figura 2 1, într-o abordare de jos în sus, se pleacă de la un nivel de bază pentru a se construi deasupra lui un număr de niveluri derivate Pe nivelul de bază se află diferite componente ale problemei care trebuie rezolvată într-un anumit limbaj de programare Prin utilizarea posibilităŃilor oferite de limbaj se creează deasupra acestuia un prim nivel de instrumente ori funcŃii, capabile să facă faŃă cerinŃelor problemei si, eventual, chiar să le depăsească Acest nivel poate fi văzut ca un alt limbaj, superior celui aflat la bază În acelasi mod, nivelurile superioare se creează deasupra celor imediat inferioare, până la atingerea specificaŃiilor proiectate În particular, Lisp-ul invită nu numai la crearea unor limbaje de nivel intermediar bazate pe definiŃii de funcŃii si în care construcŃiile să rezulte prin manipularea apelurilor, ci inclusiv la inventarea unor sintaxe speciale care să se integreze cerinŃelor nivelurile de proiectare respective Invers, într-o abordare de sus în jos, se pleacă de la o proiectare iniŃială a soluŃiei Această soluŃie, definită în termeni generali, face apoi obiectul unor rafinamente succesive, până la rezolvarea efectivă a problemei Dificultatea într-o astfel de abordare constă în centrarea proiectului iniŃial pe soluŃie fără a se scăpa din vedere aspecte ce ar putea să o facă neaplicabilă pe unele cazuri speciale – „capetele problemei” Într-o astfel de deplasare nefericită nu deranjează acoperirea Cristea, IoniŃă, Pistol – InteligenŃa Artificială 15 proiectarea de jos în sus proiectarea de sus în jos cazuri neprevăzute în proiect, posibil a fi acoperite de soluŃie cazuri prevăzute în proiect dar neacoperite de soluŃie cazuri prevăzute în proiect si acoperite de soluŃie unor aspecte neavute în vedere iniŃial ci neacoperirea altora care sunt esenŃiale în rezolvarea problemei Figura 2 1: Crearea programelor bottom-up faŃă de top-down 2 2 FuncŃii, maniere de definire si apel 2 2 1 TransparenŃa referenŃială Spunem că o funcŃie este transparentă referenŃial dacă valoarea întoarsă de ea depinde numai de parametrii pe care i-a primit în intrare Astfel, dacă scriem în limbajul C: function foo1(x) { return(x+2); } valoarea întoarsă de funcŃia foo1 depinde, la orice apel al ei, numai de valoarea intrării x Dacă însă o transformăm în: int a=2; int function foo2(int x) { return(x+a); } atunci valoarea întoarsă de foo2 la un apel al acesteia de forma foo2(3), de exemplu, depinde nu numai de valoarea intrării x, care este 3 în cazul de faŃă, ci si de a variabilei globale a (2 în cazul de faŃă) Spunem deci că foo1 este transparentă referenŃial în timp ce foo2 – nu 2 2 2 Efectul lateral Se spune că o funcŃie are un efect lateral dacă evaluarea ei adaugă contextului si alte modificări decât strict valoarea întoarsă de funcŃie Astfel, funcŃia foo1 definită mai sus nu are efecte laterale, în timp ce funcŃia foo3 de mai jos, are: int a; function foo3(int x) { a := x+2; Cristea, IoniŃă, Pistol – InteligenŃa Artificială 16 return(a); } pentru că, în afara valorii întoarse, ea mai provoacă asignarea unei valori variabilei globale a 2 2 3 De la notaŃia lambda la Lisp pur Lisp este unul dintre cele mai vechi limbaje de programare aflate încă în largă utilizare (numai FORTRAN este mai vechi decât el) Primele specificaŃii ale limbajului au fost elaborate de John McCarthy, în 1958 si publicate în 1960 (McCarthy, 1960), pe baza calculului-l dezvoltat de Alonso Church (Church, 1941) si a unor dezvoltări precedente ce au aparŃinut în principal lui Herbert Simon si Allen Newell (Logic Theory Machine si General Problem Solver, programe dezvoltate în limbajul IPL inventat de Newell) În notaŃia lambda, într-o definiŃie de funcŃie se pun în evidenŃă parametrii formali ai funcŃiei si corpul ei: l(x) = x+2; sau: l(x,y) = x+y; Într-o astfel de notaŃie funcŃiile nu au nume Asocierea unui nume funcŃiilor, în vederea creării posibilităŃii de apel al lor, trebuie făcută explicit: function f: l(x) = x+2; function g: l(x,y) = x+y; Într-un apel de funcŃie trebuie să apară numele ei urmat de o listă de parametri actuali: f(3) g(5,1) Un apel poate, în anumite condiŃii, să amorseze un proces de evaluare care să ducă la generarea unui rezultat În evaluare se disting două faze: prima în care parametrii formali ai funcŃiei sunt legaŃi la valorile corespunzătoare ale parametrilor actuali din corpul definiŃiei funcŃiei si a doua în care are loc evaluarea expresiei astfel obŃinute a corpului funcŃiei În evaluarea corpului pot să intervină alte apeluri de funcŃie, care se derulează în aceeasi manieră Astfel se pot apela funcŃii în funcŃii Spunem că un apel poate, în anumite condiŃii, porni un proces de evaluare, pentru că o scriere precum f(3) nu garantează efectuarea evaluării Ea nu este decât o simplă notaŃie până ce se comandă explicit unui evaluator (uman sau masină) începerea unui astfel de proces: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 17 g(f(3),1) >>> g(5,1) >>> 6 unde >>> trebuie citit „se evaluează la” Între caracteristicile esenŃiale care definesc asa-numitul Lisp pur se numără faptul că funcŃiile sunt transparente referenŃial, că funcŃiile nu au efecte laterale si că din limbaj lipsesc asignările 2 2 4 Evaluarea numerică faŃă de evaluarea simbolică Fie funcŃia f definită mai sus Apelată asupra parametrului 3 avem o evaluare numerică: f(3) >>> 3 + 2 >>> 5 Dacă însă parametrul actual care ia locul parametrului formal x din corpul definiŃiei funcŃiei este unul nenumeric, să zicem a, atunci avem de a face cu o evaluare simbolică: f(a) >>> a + 2 pentru că forma rezultată conŃine un simbol nenumeric 2 2 5 Beneficiile unui Lisp impur: Common Lisp Pe considerente de crestere a puterii de expresie a limbajului si de mărire a productivităŃii activităŃii de programare, Lisp-ul pur a fost ulterior impurificat în absolut toate direcŃiile posibile, fără însă a pierde, prin aceasta, sclipirea de geniu originală Astfel, după cum vom constata în cele ce urmează, s-au acceptat definiŃii de funcŃii care să nu mai respecte trăsătura de transparenŃă referenŃială (fără a le face însă astfel opace referenŃial ), s-au încurajat efectele laterale, s-au adoptat câteva operaŃii de asignare, ba chiar s-a permis ca o funcŃie să întoarcă mai mult decât o unică valoare, această din urmă „trădare” făcându-se însă, aparent paradoxal, fără să se încalce câtusi de puŃin definiŃia matematică a funcŃiei (o corespondenŃă de la un domeniu de intrare la un domeniu de iesire în care oricărei valori de intrare îi corespunde o singură valoare de iesire) 2 3 Tipuri de date în Lisp Schema următoare face o clasificare a celor mai uzuale tipuri de date în Lisp: s-expresie (expresie simbolică – symbolic expression) atom numeric întreg raŃional (fracŃie) real complex Cristea, IoniŃă, Pistol – InteligenŃa Artificială 18 nenumeric (în fapt atom literal, noi îi vom numi atom simbolic sau, simplu, simbol) listă listă simplă listă cu punct sir (array) sir de caractere tablou (cu oricâte dimensiuni) tabelă de asociaŃie (hash table) – structură de date care permite asocierea si regăsirea cu usurinŃă a valorilor atasate simbolurilor; pachet (sau spaŃiu de nume) – colecŃii încapsulate de simboluri Un parser Lisp recunoaste un nume prin căutarea lui în pachetul curent; flux de date – sursă de date, tipic sir de caractere, utilizată pentru canalizarea operaŃiilor de intrare/iesire Numai datele au tipuri O variabilă în Lisp nu are definit un tip Ea poate primi ca valoare orice tip de dată 2 3 1 ConstrucŃiile limbajului În Lisp operăm cu următoarele categorii de obiecte: variabile, constante, date, funcŃii, macro-uri si forme speciale (la acestea mai trebuie adăugate clasele si metodele în implementările orientate-obiect) Variabilele sunt asociaŃii între simboluri utilizate în anumite spaŃii lexicale ale limbajului si valori asociate acestora După cum vom vedea mai departe, există trei moduri prin care o variabilă poate să primească valori, uneori chiar mai multe odată: prin asignare, prin legare si prin intermediul listelor de proprietăŃi Două dintre aceste moduri de a primi valori (asignarea si listele de proprietăŃi) sunt caracteristice oricărui simbol Lisp Ceea ce diferenŃiază un simbol lexical de o variabilă sunt numai situaŃiile în care variabilele pot fi legate la valori Constantele sunt simboluri (în general ale sistemului) care au atasate valori ce nu pot fi modificate În Lisp nu există proceduri ci numai funcŃii, în sensul că orice rutină întoarce obligatoriu si o valoare Macro-urile sunt funcŃii care au un mecanism de evaluare special, în doi pasi: expandarea si evaluarea propriu-zisă (prezentate în secŃiunea 2 6 Macro-uri) Formele speciale sunt funcŃii de sistem care au, în general, o sintaxă si un comportament aparte 2 3 2 Un pic de sintaxă Următoarele caractere au o semnificaŃie specială în Lisp: ( – o paranteză stângă marchează începutul unei liste; ) – o paranteză dreaptă marchează sfârsitul unei liste; ’ – un apostrof, urmat de o expresie e, ’e, reprezintă o scriere condensată pentru un apel (quote e); Cristea, IoniŃă, Pistol – InteligenŃa Artificială 19 ; – punct-virgula marchează începutul unui comentariu El însusi, împreună cu toate caracterele care urmează până la sfârsitul rândului, sunt ignorate; ” – între o pereche de ghilimele se include un sir de caractere; \ – o bară oblică stânga prefixează un caracter pe care dorim să-l utilizăm în contextul respectiv ca o literă si nu cu semnificaŃia lui uzuală De exemplu, sirul de caractere ”a\”B” este format din trei caractere: a, ” si B pentru că cel de al doilea rând de ghilimele nu trebuie considerate ca închizând sirul ci ca un simplu caracter din interiorul lui; | – între o pereche de bare verticale poate fi dat un sir de caractere speciale pe care dorim să le utilizăm într-un nume de simbol Inclusiv caracterul bară oblică stânga (\) poate apare între o pereche de bare verticale, dar ea îsi păstrează semnificaŃia de prefix În particular, ea poate prefixa o bară verticală între o pereche de bare verticale Astfel, sirurile: |& +\:;| a|& +\|:;|b a|& +\| 2) |b unde prin am notat caracterul rând-nou (new line), pot constitui nume de simboluri; # – un diez semnalează că următorul caracter defineste modul în care trebuie interpretată construcŃia care urmează Cea mai importantă utilizare a diezului este de a semnala o formă funcŃională, într-o secvenŃă de genul: #’fn, unde fn este un nume sau o lambda expresie (definiŃie de funcŃie fără nume); ` – un accent invers semnalează că ceea ce urmează este un template care conŃine virgule (mai multe despre template-uri, în secŃiunea 2 6 2 Despre apostroful-stânga) Un template funcŃionează ca un program care modifică forma unui sir de obiecte Lisp; , – virgulele sunt utilizate în interiorul template-urilor pentru a semnala cazuri speciale de înlocuiri; : – două puncte semnalează, în general, că următorul simbol trebuie privit ca un simbol constant care se evaluează la el însusi În alte cazuri, două puncte despart numele unui pachet de numele unei variabile definite în acel pachet (de exemplu, în user1:alpha, user1 este numele unui pachet, iar alpha este numele unei variabile) Implementările uzuale de Common Lisp sunt insensibile la forma caracterelor (minuscule sau majuscule) Intern însă, formele Lisp sunt reprezentate cu majuscule, de aceea formele rezultate în urma evaluărilor sunt redate în astfel de caractere Numerele întregi zecimale pot fi precedate opŃional de un semn si urmate opŃional de un punct zecimal (adăugarea unui zero după punct le transformă însă în numele reale) Numere întregi în alte baze au sintaxa #nnRddddd sau #nnrddddd, în care nn exprimă baza iar ddddd – numărul Bazele 2, 8 si 16 permit si o altă scriere, respectiv #b pentru #2r, #o pentru #8r, si #x pentru #16r FracŃiile, sau numerele raŃionale, sunt reprezentate ca rapoarte dintre un numărător si un numitor, adică o secvenŃă: semn (opŃional), întreg (numărător), caracterul /, întreg (numitor) Reprezentarea internă si cea tipărită este Cristea, IoniŃă, Pistol – InteligenŃa Artificială 20 întotdeauna a unei fracŃii simplificate Dacă numărătorul e notat în altă bază decât cea zecimală, numitorul va fi interpretat în aceeasi bază O fracŃie simplificabilă la un întreg este convertită automat la întreg Numitorul trebuie să fie diferit de zero Exemple de fracŃii: 1/2 -2/3 4/6 (echivalent cu fracŃia 2/3) #o243/13 (echivalent cu 163/11) Numerele reale au notaŃia obisnuită ce cuprinde punctul zecimal, semnul (opŃional) si puterea (opŃional) Formatul simplu sau dublu poate, de asemenea, fi specificat: 3 1415926535897932384d0 ; o aproximare în format dublu pentru 6 02E+23 ; numărul lui Avogadro Numerele complexe sunt notate ca o secvenŃă: #c( , ), în care si sunt numere în acelasi format Exemple de numere complexe: #c(1 2) ; numărul 1 + 2*i #c(0 1) ; numărul i #c(2/3 1 3) ; convertit intern la #c(0 6666667 1 3) Orice combinaŃie de litere si cifre poate constitui un nume de simbol În plus, oricare dintre următoarele caractere poate interveni într-un nume de simbol: + - * / @ $ % ^ & = ~ 5 Printre altele, asadar, următoarele siruri pot fi nume de simboluri: alpha a21 1a2 *alpha* (variabilele globale sau de sistem au, în general, nume care încep si se încheie cu asterisc) a+b a-b+c a/1 $13 1%2 a^b cel mare a=b a Orice expresie ce urmează a fi evaluată se prezintă pe un rând imediat după prompter, pentru ca pe rândul următor să apară rezultatul tipărit al evaluării Expresiile se evaluează după câteva reguli simple: - un atom numeric se evaluează la el însusi: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 23 > 3 3 > 3 14 3 14 În Lisp pot fi reprezentate numere oricât de mari fără riscul de a provoca vreo depăsire: > 9999999999999999999999999999999999999999999999999999999 9999999999999999999999999999999999999999999999999999999 - un atom simbolic care are o valoare predefinită (în sensul asignării sau al legării) se evaluează la această valoare Astfel, presupunând că simbolului a i se asociase anterior valoarea alpha: > a alpha ExcepŃie fac simbolurile: nil care, fiind notaŃia pentru lista vidă cât si pentru valoarea logică fals, se evaluează la el însusi si t care se evaluează la valoare logică adevărat (true sau TRUE) Orice s-expresie diferită de nil este considerată a fi echivalentă logic cu true: > nil NIL > t TRUE - un atom simbolic care nu are o valoare predefinită dacă este evaluat va provoca un mesaj de eroare de genul UNBOUND-VARIABLE; - o expresie simbolică prefixată cu apostrof (quote) se evaluează la ea însăsi: > ’alpha alpha > ’3 3 > ’(a 3 ()) (a 3 NIL) - o listă care are pe prima poziŃie un atom recunoscut ca nume de formă Lisp predefinită sau de funcŃie definită de utilizator se evaluează astfel: forma Lisp sau funcŃia dictează maniera în care se face evaluarea următoarelor elemente ale listei: care dintre acestea se evaluează si care sunt lăsate neevaluate Evaluate ori nu, argumentele apelului sunt trecute apoi corpului formei sau al funcŃiei, drept parametri actuali Valoarea rezultată în urma evaluării corpului formei sau funcŃiei cu acesti parametri este cea care se întoarce: > (+ 2 1) 3 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 24 Primul element al listei este recunoscut drept numele funcŃiei de adunare, + Parametrii adunării rezultă prin evaluarea următoarelor două elemente ale listei, respectiv atomii numerici 2 si 1 Cum evaluarea îi lasă neschimbaŃi, ei sunt trecuŃi ca atare drept parametri actuali ai adunării Aplicarea funcŃiei + asupra lor produce rezultatul 3, care este tipărit În Lisp, operatorii de calcul aritmetic, ca si orice alt nume de funcŃie, se notează înaintea argumentelor (notaŃie prefixată) > (setq a ’alpha) alpha Primul element al listei este recunoscut drept forma Lisp setq Forma setq asignează argumentelor din apel de pe poziŃiile impare valorile rezultate din evaluarea argumentelor din apel de pe poziŃiile pare Astfel simbolului a i se asignează rezultatul evaluării lui ’alpha adică alpha Valoarea ultimului element al listei este si valoarea întoarsă de funcŃie Forma setq constituie un exemplu de funcŃie cu efect lateral, efect ce se manifestă prin lăsarea în context a unor valori asignate unor simboluri nenumerice Forma setq este prima dintr-o serie de forme cu care ne vom întâlni mai departe si care sunt utilizate cu precădere pentru efectele lor laterale mai degrabă decât pentru valorile întoarse de ele - evaluarea unei liste care are pe prima poziŃie o lambda-expresie va fi prezentată în secŃiunea 2 4 15 Lambda expresii; - o listă care are pe prima poziŃie un nume de macrodefiniŃie va fi prezentată în secŃiunea 2 6 Macro-uri; - orice altceva (ca de exemplu, o listă care are pe prima poziŃie o listă diferită de o lambda-expresie, sau un atom ce nu este cunoscut ca nume de formă Lisp sau macro, asadar nu face parte din biblioteca de funcŃii ale Lisp-ului si nici nu este o funcŃie definită de utilizator) provoacă, în momentul lansării în evaluare, un mesaj de eroare de genul UNDEFINED-FUNCTION 2 4 FuncŃii si forme Lisp 2 4 1 NotaŃii Am vorbit până acum despre funcŃii si forme Lisp fără să precizăm distincŃia dintre ele FuncŃiile Lisp-ului îsi evaluează toate argumentele înainte de a le transfera corpului funcŃiei În afara funcŃiilor, prin utilizarea macro-urilor (v secŃiunea 2 6 Macro-uri), s-au creat forme speciale care aplică reguli specifice de evaluare a argumentelor Limbajul Lisp numără o clasă semnificativă de funcŃii si de forme predefinite În prezentarea funcŃiilor si a formelor vom adopta o convenŃie de notaŃie, care să ne permită să identificăm argumentele ce se evaluează faŃă de cele care nu se evaluează, tipul acestora, rezultatul evaluării, precum si manifestarea, atunci când va fi cazul, a efectelor laterale Aceste convenŃii de notare sunt următoarele: e – s-expresie n – atom numeric i – număr întreg c – număr complex Cristea, IoniŃă, Pistol – InteligenŃa Artificială 25 s – atom nenumeric (simbolic) l – listă f – funcŃională (nume sau definiŃie de funcŃie sau formă) Dacă un astfel de simbol, aflat pe poziŃia unui argument al unui apel de formă Lisp, este prefixat cu un apostrof (’e, spre exemplu), vom înŃelege că argumentul aflat pe acea poziŃie se evaluează la un obiect Lisp de tipul indicat de simbol (sexpresie, în cazul exemplului de mai sus) Dimpotrivă, dacă el este notat fără apostrof, atunci argumentul respectiv, ce trebuie să respecte tipul indicat de simbol, nu se evaluează (să observăm că această convenŃie este una mnemonică pentru că, într-adevăr, prin evaluarea unui obiect Lisp prefixat cu un apostrof, rămânem cu argumentul fără prefix) În plus, pentru simplificare, vom nota întotdeauna argumentele ce rezultă în urma evaluării obiectelor prefixate cu apostrof, prin aceleasi litere Astfel, dacă ’n1,… ’nk sunt argumentele evaluabile si de tip numeric ale unui apel, vom considera, fără a mai menŃiona acest lucru, că numerele ce rezultă în urma evaluării acestora sunt notate cu n1,… nk De asemenea, vom considera de la sine înŃeles că orice apel realizat cu argumente de tipuri diferite celor indicate în definiŃii duce la generarea unor mesaje de eroare Ca si mai sus, vom utiliza simbolul >>> cu semnificaŃia „se evaluează la” Astfel, în definiŃiile de funcŃii care urmează, printr-o notaŃie e1 >>> e2 vom înŃelege că forma Lisp e1 (o s-expresie, în acest caz) se evaluează la forma e2 (de asemenea o s-expresie) Vom renunŃa însă la descrierea formală a valorii întoarse în favoarea unei descrieri libere, atunci când, datorită complexităŃii operaŃiilor efectuate de formă sau funcŃie, o descriere formală ar începe să semene mult prea mult cu însăsi o implementare a ei RenunŃarea la restricŃiile unui Lisp pur a dus inclusiv la acceptarea unui mecanism de evaluare care să întoarcă mai mult decât o singură valoare Astfel, construcŃia values din Common Lisp pune într-o structură specială valori multiple (vom vedea în secŃiunea 2 5 8 Valori multiple si exploatarea lor) cum pot exploatate acestea) În notaŃia noastră vom separa prin virgule valorile multiple rezultate dintr-o evaluare: e1 >>> e2,…,en În plus, vom nota prin ~nil o valoare despre care ne interesează să stim că e diferită de nil În cazul în care evaluarea produce si efecte laterale, le vom nota după o bară verticală: e1 >>> e2 | Un anumit tip de efect lateral, atribuirea unei valori unui simbol, va fi notat printr-o săgeată orientată stânga: se, cu semnificaŃia: simbolul s se leagă la valoarea e, sau simbolului s i se asignează valoarea e De asemenea, în notarea efectelor laterale, vom atribui virgulei (,) semnificaŃia unui operator de execuŃie serială si dublei linii verticale (‖), cea de operator de execuŃie paralelă Cu alte cuvinte, o secvenŃă de efecte laterale E1,…,Ek va semnifica consumarea secvenŃială, în ordinea stânga-dreapta, a acestora, pe când printr-o notaŃie E1‖ ‖Ek vom înŃelege consumarea acelorasi efecte în paralel Atunci când este important momentul evaluării formei care produce valoarea întoarsă de apelul de funcŃie relativ la momentele producerii efectelor laterale, vom nota evaluarea formei care produce valoarea întoarsă printre efectele laterale într-o pereche de paranteze pătrate, de exemplu: [e] Cristea, IoniŃă, Pistol – InteligenŃa Artificială 26 Dacă anumite efecte laterale, produse pe parcursul evaluării unei forme, nu sunt persistente, în sensul că nu rămân ca observabile în contextul de evaluare a formei si după terminarea evaluării formei, atunci îndepărtarea lor este notată explicit Astfel, îndepărtarea efectului asignării unei valori simbolului s va fi notată unbind(s) Pentru a descrie acŃiuni repetitive vom folosi structura de iterare while { } intercalată în lista efectelor laterale În prezentările apelurilor de funcŃii pot să apară si cuvinte cheie, care se recunosc pentru că sunt întotdeauna prefixate cu caracterul două-puncte (:) Într-un apel real ele trebuie reproduse ca atare Astfel de cuvinte cheie, pot fi: :test cu semnificaŃia că ceea ce urmează este un test care va acŃiona prin valoarea T; de obicei el prefixează un nume de funcŃională, care este dat în sintaxa #’f; :test-not – prefixează un test care acŃionează prin valoarea NIL 2 4 2 Asignarea unei valori unui simbol Într-un limbaj imperativ, o notaŃie de genul x:=y, unde x si y sunt variabile, este în general recunoscută ca având interpretarea: se atribuie variabilei x valoarea pe care o are variabila y Să observăm însă că, în sine, o astfel de notaŃie lasă loc la cel puŃin încă două interpretări: variabila x „se leagă” la variabila y, înŃelegând prin aceasta că încât ori de câte ori y se va modifica, x se va modifica în acelasi mod si variabilei x i se atribuie ca valoare însusi simbolul y După cum vom vedea, Lisp-ul face posibile toate aceste interpretări Cea mai apropiată de accepŃiunea din limbajele imperative, „atribuirea” (sau „asignarea”) unei valori este prezentată în continuare Despre forma setq s-a vorbit deja informal în secŃiunea 2 3 4 (Evaluarea expresiilor Lisp) Evaluarea argumentelor de pe poziŃiile pare si, respectiv, asignările se fac în ordine, de la stânga la dreapta: (setq s1 ’e1… sk ’ek) >>> ek|s1e1,…,sk[ek] > (setq x ’(a b c) y (cdr x)) (B C) Forma set este ca si setq numai că ea îsi evaluează toate argumentele: dacă ’e1 >>> s1,… ’e2*k-1 >>> s2*k-1 atunci: (set ’e1 ’e2… ’e2*k-1 ’e2*k) >>> e2*k|s1e2,… s2*k-1[e2*k] > (set (car ’(x y)) ’(a b c) (car x) (cdr x)) (B C) > a (B C) Forma psetq este analogă lui setq cu deosebirea că asignările se fac în paralel: mai întâi toate formele de rang par sunt evaluate serial si apoi tuturor variabilelor (simbolurile de pe poziŃiile impare) le sunt asignate valorile corespunzătoare: dacă ’e1 >>> s1,… ’e2*k-1 >>> s2*k-1 atunci: (psetq ’e1 ’e2… ’e2*k-1 ’e2*k) >>> e2*k|e2,…,[e2*k],s1e2‖…‖ s2*k-1e2*k Cristea, IoniŃă, Pistol – InteligenŃa Artificială 27 În exemplul următor valorile lui x si y sunt schimbate între ele: > (setq x ‘a) A > (setq y ‘b) B > (psetq x y y x) NIL > x B > y A 2 4 3 FuncŃii pentru controlul evaluării Am văzut deja că prefixarea unei s-expresii cu un apostrof este echivalentă apelului unei funcŃii quote Asadar quote împiedică evaluarea: (quote e) >>> e FuncŃia eval forŃează încă un nivel de evaluare Astfel, dacă: ’e1 >>> e2 si ’e2 >>> e3 , atunci: (eval ’e1) >>> e3 > (setq x 'a a 'alpha) ALPHA > (eval x) ALPHA > (eval ’(+ 1 2)) 3 2 4 4 OperaŃii asupra listelor ConstrucŃia listelor FuncŃia cons construieste o celulă din două s-expresii, rezultate din evaluarea celor două argumente, punându-l pe primul în jumătatea car si pe cel de al doilea în jumătatea cdr: (cons ’e1 ’e2) >>> (e1 e2) > (cons ’a nil) (A) > (cons ’a ’b) (A B) > (cons ’a ’(a b)) (A A B) > (cons ’alpha (cons ’beta nil)) (ALPHA BETA) FuncŃia list creează o listă din argumentele sale evaluate: (list ’e1 … ’ek) >>> (e1 (…(ek nil)…)) > (list ’a ’b ’c) (A B C) > (list ’a ’(b c)) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 28 (A (B C)) FuncŃia append creează o listă prin copierea si punerea cap la cap a listelor obŃinute din evaluarea argumentelor sale Astfel, dacă: ’l1 >>> (e11 (…(e1k 1 nil)…)),…, ’ln >>> (en1 (…(enk n nil)…)) atunci: (append ’l1 … ’ln) >>> (e11 (…(e1k 1 (…(en1 (…(enk n nil)…))…))…)) > (append ’(a b c) ’(alpha beta) ’(1 gamma 2)) (A B C ALPHA BETA 1 GAMMA 2) De notat că ultimul argument poate fi orice s-expresie, iar nu o listă cu necesitate > (setq l1 (list 'a 'b) l2 (list 'c 'd 'e) l3 'f) F > (append l1 l2 l3) (A B C D E F) FuncŃia creează celule cons noi corespunzătoare tuturor elementelor listelor componente, cu excepŃia celor aparŃinând ultimei liste, pe care le utilizează ca atare Accesul la elementele unei liste FuncŃiile car si cdr extrag s-expresiile aflate în poziŃiile car, respectiv cdr, ale unei celule cons Dacă lista e vidă car întoarce încă nil Dacă ’l >>> (e1 e2), atunci: (car ’l) >>> e1 (cdr ’l) >>> e2 (car nil) >>> nil (cdr nil) >>> nil > (car ’(a b c)) A > (car ’((alpha beta) b c)) (ALPHA BETA) > (cdr ’(a b c)) (B C) > (cdr ’(a)) NIL > (cdr ’(a b)) B Prin combinaŃii car-cdr poate fi accesat orice element de pe orice nivel al unei liste Pentru simplificarea scrierii, implementările de Lisp pun la dispoziŃie notaŃii condensate, ca de exemplu caddar în loc de (car (cdr (cdr (car )))) FuncŃia nth selectează un element de pe o poziŃie precizată a unei liste Primul argument trebuie să fie un întreg nenegativ si desemnează numărul de ordine, iar al doilea – o listă, din ea urmând a se face selecŃia Dacă ’l >>> (e0 (…(em nil)…)) si 0£n£m, atunci: (nth ’n ’l) >>> en Dacă n>m, atunci: (nth ’n ’l) >>> nil Cristea, IoniŃă, Pistol – InteligenŃa Artificială 29 > (nth 1 ’(a b c)) B > (nth 3 ’(a b c)) NIL Similar, funcŃia nthcdr efectuează de un număr întreg si pozitiv de ori cdr asupra unei liste Dacă l=(e0 (…(em nil)…)) si 0£n£m, atunci: (nth ’n ’l) >>> (en (…(em nil)…)) Dacă n>m, atunci: (nth ’n ’l) >>> nil > (nthcdr 0 ’(a b c)) (A B C) > (nthcdr 1 ’(a b c)) (B C) > (nthcdr 4 ’(a b c)) NIL FuncŃia last întoarce ultima celulă cons a unei liste Dacă l=(e1 (…(ek nil)…)), atunci: (last ’l) >>> (ek nil) (last nil) >>> nil > (last ’(a b c)) (c) > (last (cons ’a ’b)) (A B) > (last (cons ’a nil)) (A) 2 4 5 OperaŃii cu numere Lisp-ul are o bibliotecă foarte bogată de funcŃii aritmetice Dintre ele, prezentăm doar câteva în rândurile următoare OperaŃiile de adunare, scădere, înmulŃire si împărŃire (k ³ 1): (+ ’n1 …’nk) >>> n1 + … + nk (- ’n) >>> -n si dacă k > 1, atunci: (- ’n1 …’nk) >>> n1 - … - nk (* ’n1 …’nk) >>> n1 * … * nk (/ ’n1 …’nk) >>> n1 / … / nk > (+ 1 2 3) 6 > (- 5 (+ 3 3) 2) -3 > (* 1 2 3) 6 > (/ 6 3 2) 1 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 30 FuncŃia / întoarce o fracŃie (număr raŃional) dacă argumentele ei sunt numere întregi si împărŃirea nu e exactă > (/ 2 3) 2/3 Această funcŃie, ca si tipul de dată număr raŃional, oferă, asadar, o cale foarte elegantă de a opera cu fracŃii zecimale: > (+ 1 (/ 2 3)) 5/3 > (* (/ 2 3) (/ 3 2)) 1 > (+ (/ 1 3) (/ 2 5)) 11/15 Asa cum am arătat si mai sus, reprezentarea numerelor ca liste face să nu existe limite ce pot fi atinse usor în operaŃiile cu acestea, de aceea apeluri ca cele de mai jos sunt posibile: > (* 99999999999999999999999999999999999999999999999999999999 8888888888888888888888888888888888888888888888888888) 888888888888888888888888888888888888888888888888888799991111111111111 111111111111111111111111111111111111112 Pentru toate funcŃiile aritmetice acŃionează următoarea regulă de contaminare: în cazul în care argumentele unei funcŃii numerice nu sunt de acelasi tip, toate sunt aduse la tipul celui mai „puternic”, conform următoarei ierarhii: complex > real > raŃional > întreg Reguli de canonizare Un raŃional cu numitor 1 e considerat întreg, un real cu 0 după virgulă e considerat întreg, un complex cu partea imaginară 0 e considerat real > (+ (/ 1 3) (/ 2 0 5)) 0 73333335 Toate operaŃiile de mai sus se aplică si asupra argumentelor numere complexe: > (+ #c(1 2) #c(3 2)) #c(4 4) > (- #c(1 2) #c(3 2)) -2 > (* #c(1 2) #c(3 2)) #c(-1 8) > (/ #c(1 2) #c(3 2)) #c(7/13 4/13) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 31 Există mai multe funcŃii de rotunjire a unei valori FuncŃiile floor si ceiling rotunjesc o valoare în jos, respectiv în sus Dacă n este întreg, real sau zecimal si m£n >> m, n - m (ceiling ’n) >>> m + 1, n – (m + 1) > (floor 2) 2 0 > (floor 2 9) 2 0 9000001 > (floor 2/3) 0 2/3 > (ceiling 2) 2 0 > (ceiling 2 9) 3 -0 099999905 > (ceiling 2/3) 1 -1/3 Dacă apelurile se efectuează cu două argumente întregi se obŃine calculul câtului si al restului (comportamentul unei funcŃii care calculează modulo) Astfel, dacă c este cel mai mic întreg pozitiv si r este un întreg pozitiv astfel încât n1 = c * n2 + r, atunci: (floor ’n1 ’n2) >>> c, r (ceiling ’n1 ’n2) >>> c + 1, -r >(floor 7 3) 2 1 >(ceiling 7 3) 3 -2 Există două forme Lisp de incrementare, respectiv, decrementare, fără efecte laterale: funcŃiile 1+, respectiv 1-: (1+ ’n) >>> n + 1 (1- ’n) >>> n - 1 > (setq x 1) 1 > (1+ x) 2 > x 1 > (1- x) 0 > x 1 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 32 După cum se observă, funcŃiile nu afectează argumentele Macro-urile incf si decf fac acelasi lucru, dar afectează argumentele: (incf ’n) >>> n + 1 | n  n + 1 (decf ’n) >>> n - 1 | n  n - 1 > (setq x 1) 1 > (incf x) 2 > x 2 > (decf x) 1 > x 1 Dacă în apel apare si un al doilea argument, el e considerat incrementul, respectiv decrementul: (incf ’n1 ’n2) >>> n1 + n2 | n1  n1 + n2 (decf ’n1 ’n2) >>> n1 - n2 | n1  n1 - n2 > (setq x 1) 1 > (incf x 2) 3 > x 3 > (decf x 4) -1 > x -1 De notat că argumentele funcŃiilor 1+, 1-, incf si decf pot fi orice fel de număr, inclusiv complex În acest din urmă caz incrementarea, respectiv, decrementarea se aplică numai părŃii reale Calculul valorii absolute: dacă n³0, atunci: (abs ’n) >>> n Dacă n >> -n > (abs (- 3 5)) 2 Dacă argumentul este număr complex, rezultatul este modulul, considerat ca număr real > (abs #c(3 -4)) 5 0 FuncŃiile max si min calculează maximumul si minimumul unor siruri de numere Dacă n=max(n1,… nk), atunci: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 33 (max ’n1 … ’nk) >>> n Dacă n=min(n1,… nk), atunci: (min ’n1 … ’nk) >>> n Aritmetica numerelor complexe În afara operaŃiilor uzuale cu numere, ce se răsfrâng si asupra numerelor complexe (*, -, *, /, 1+, 1-, incf, decf, abs), următoarele funcŃii acceptă ca argumente numai numere complexe: conjugate, realpart, imagpart Dacă ’c >>> #c(n1 n2), atunci: (conjugate ’c) >>> #c(n1 -n2) (realpart ’c) >>> n1 (imagpart ’c) >>> n2 FuncŃia complex compune un număr complex dintr-o parte reală si una imaginară: (complex ’n1 ’n2) >>> #c(n1 n2) > (conjugate (complex 1 2)) #c(1 -2) > (realpart (complex 2 3)) 2 > (imagpart (complex 2 3)) 3 2 4 6 Predicate Predicatele sunt funcŃii care întorc valori de adevăr Multe dintre ele verifică tipuri si relaŃii Dacă e este un atom, atunci: (atom ’e) >>> t altfel: (atom ’e) >>> nil Dacă e este un atom simbolic, atunci: (symbolp ’e) >>> t altfel: (symbolp ’e) >>> nil Dacă e este număr, atunci: (numberp ’e) >>> t altfel: (numberp ’e) >>> nil Dacă e este număr întreg, atunci: (integerp ’e) >>> t altfel: (integerp ’e) >>> nil Dacă e este număr real, atunci: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 34 (floatp ’e) >>> t altfel: (floatp ’e) >>> nil Dacă n este număr întreg par, atunci: (evenp ’n) >>> t altfel: (evenp ’n) >>> nil Dacă n este număr întreg impar, atunci: (oddp ’n) >>> t altfel: (oddp ’n) >>> nil Dacă n este număr si n³0, atunci: (plusp ’n) >>> t altfel: (plusp ’n) >>> nil Dacă n este număr si n£0, atunci: (minusp ’n) >>> t altfel: (minusp ’n) >>> nil Dacă n=0, atunci: (zerop ’n) >>> t altfel: (zerop ’n) >>> nil Dacă n1= … =nk, atunci: (= ’n1 … ’nk) >>> t altfel: (= ’n1 … ’nk) >>> nil Dacă n1 >> t altfel: ( >> nil Dacă n1> … >nk, atunci: (> ’n1 … ’nk) >>> t altfel: (> ’n1 … ’nk) >>> nil Dacă n1£ … £nk, atunci: ( >> t altfel: ( >> nil Cristea, IoniŃă, Pistol – InteligenŃa Artificială 35 Dacă n1³ … ³nk, atunci: (>= ’n1 … ’nk) >>> t altfel: (>= ’n1 … ’nk) >>> nil Dacă ’e >>> s si s este un simbol legat, atunci: (boundp ’e) >>> t altfel: (boundp ’e) >>> nil > (setq x ’y y ’z) Z > (boundp ’x) T > (boundp x) T > (boundp ’y) T > (boundp y) NIL Dacă e1 si e2 sunt izomorfe structural (desi pot fi obiecte Lisp distincte) atunci: (equal ’e1 ’e2) >>> t altfel: (equal ’e1 ’e2) >>> nil > (equal ’alpha ’alpha) T > (equal ’(a b c) (cons ’a (cons ’b (cons ’c nil)))) T > (equal ’(a b c) (cons ’a (cons ’b ’c))) NIL > (setq x ’(a b c) y (cdr x)) (B C) >(equal y ’(b c)) T >(equal (cdr x) y) T Dacă e1 si e2 reprezintă aceeasi structură (obiect) Lisp, cu alte cuvinte, dacă ele adresează elemente aflate la aceeasi adresă în memorie, atunci: (eq ’e1 ’e2) >>> t altfel: (eq ’e1 ’e2) >>> nil > (eq ’alpha ’alpha) T În Common Lisp simbolurile sunt reprezentate cu unicitate Acest lucru face ca apelul de mai sus se evalueze la T Standardul nu obligă însă reprezentarea cu Cristea, IoniŃă, Pistol – InteligenŃa Artificială 36 unicitate a numerelor si nici a sirurilor de caractere Din acest motiv nu poate fi garantat un rezultat pozitiv în cazul testării cu eq a două numere egale sau a două siruri de caractere identice si, ca urmare, astfel de operaŃii trebuie evitate: > (eq 1 1) ??? > (eq "alpha" "alpha") ??? > (eq ’(a b c) (cons ’a (cons ’b (cons ’c nil)))) NIL > (setq x ’(a b c) y (cdr x)) (B C) > (eq (cdr x) ’(b c)) NIL > (eq (cdr x) y) T Predicatul eql funcŃionează la fel ca si eq, cu excepŃia faptului că el întoarce T inclusiv pentru numere egale, deci obiecte care sunt si „conceptual”, iar nu numai strict implementaŃional, identice În privinŃa listelor si a sirurilor de caractere eq si eql se comportă la fel > (eql 1 1) T Dacă e=nil atunci: (null ’e) >>> t altfel: (null ’e) >>> nil 2 4 7 Liste privite ca mulŃimi FuncŃia member verifică existenŃa unei s-expresii într-o listă Dacă ’l >>> (e1 (…(ek (…(en nil)…))…)), unde ek este prima apariŃie a acestei sexpresii în lista l care satisface (f e ek) >>> t, cu f o funcŃională ce necesită exact doi parametri, atunci: (member ’e ’l :test #’f) >>> (ek (…(en nil)…)) Implicit, Common Lisp consideră funcŃionala de test ca fiind eql Când se doreste utilizarea acesteia în test, ea poate fi ignorată: (member ’ek ’l) >>> (ek (…(en nil)…)) > (member ’alpha ’(a alpha b alpha)) (ALPHA B ALPHA) > (member 3 '(1 2 3 4 5) :test #' (member 3 '(1 2 3 4 5) :test #'evenp) Error: EVENP got 2 args, wanted 1 arg > (member '(3 4) '(1 2 (3 4) 5)) NIL > (member '(3 4) '(1 2 (3 4) 5) :test #'equal) ((3 4) 5) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 37 > (setq x '(1 2 (3 4) 5)) (1 2 (3 4) 5) > (member (caddr x) x) ((3 4) 5) FuncŃiile union si intersection realizează reuniunea, respectiv intersecŃia, a două liste, ca operaŃii cu mulŃimi, în sensul excluderii elementelor identice Testarea identităŃii, ca si în cazul funcŃiei member, este lăsată la latitudinea programatorului Testarea trebuie realizată cu o funcŃie binară anunŃată de cuvântul cheie :test Dacă lipseste, testul de identitate se face implicit cu eql Ordinea elementelor în lista finală este neprecizată Numai forma apelului este dată mai jos: (union ’l1 ’l2 :test #’f) (intersect ’l1 ’l2 :test #’f) > (union '(a b c d) '(1 a 2 b 3)) (D C 1 A 2 B 3) > (intersection '(a b c d) '(1 a 2 b 3)) (B A) Testul excluderii poate lasă incertă provenienŃa elementelor ce se copiază în lista finală > (union '((a 1) (b 2) (c 3) (d 4)) '((a alpha) (c gamma) (e epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) ((D 4) (B 2) (A ALPHA) (C GAMMA) (E EPSILON)) > (intersection '((a 1) (b 2) (c 3) (d 4)) '((a alpha) (c gamma) (e epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) ((C 3) (A 1)) În aceste exemple testul excluderii verifică identitatea elementelor de pe poziŃia car a listelor-perechi-de-elemente ce intră în componenŃa argumentelor originale Perechile de elemente (a 1) si (a alpha), respectiv (c 3) si (c gamma) răspund pozitiv la test ProvenienŃa elementelor selectate în lista-mulŃime finală, în cazul lor, e nedecidabilă FuncŃionala lambda, utilizată în aceste exemple, este tratată în secŃiunea 2 4 15 Lambda expresii 2 4 8 OperaŃii logice si evaluări controlate Operatorii logici în Lisp sunt and, or si not Dintre acestia and si or, pentru că îsi evaluează argumentele în mod condiŃionat, sunt consideraŃi si structuri de control FuncŃia not are acelasi comportament ca si null Dacă e >>> nil, atunci: (not ’e) >>> t altfel: (not ’e) >>> nil Macro-ul and primeste un număr oarecare n³1 de argumente pe care le evaluează de la stânga la dreapta până când unul din ele întoarce nil, caz în care evaluarea se opreste si valoarea întoarsă este nil Dacă, nici unul dintre primele n-1 de argumente nu se evaluează la nil, atunci and întoarce valoarea ultimului argument Dacă ’e1 >>> nil, atunci: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 38 (and ’e1 e2 … en) >>> nil altfel, dacă ’e2 >>> nil, atunci: (and ’e1 ’e2 … en) >>> nil s a m d , altfel: (and ’e1 ’e2 … ’en) >>> en > (setq n 7) 7 > (and (not (zerop n)) (/ 1 n)) 1/7 > (setq n 0) 0 > (and (not (zerop n)) (/ 1 n)) NIL Macro-ul or primeste un număr oarecare n³1 de argumente pe care le evaluează de la stânga la dreapta până când unul din ele întoarce o valoare diferită de nil, caz în care evaluarea se opreste si valoarea acelui argument este si cea întoarsă de or Dacă, toate primele n-1 de argumente se evaluează la nil, atunci or întoarce valoarea ultimului argument Dacă ’e1 >>> ~nil, atunci: (or ’e1 e2 … en) >>> e1 altfel, dacă ’e2 >>> ~nil, atunci: (or ’e1 ’e2 … en) >>> e2 s a m d , altfel: (or ’e1 ’e2 … ’en) >>> en > (setq n 7) 7 > (or (not (zerop n)) (/ 1 n)) T > (setq n 0) 0 > (or (not (zerop n)) (/ 1 n)) Error: Attempt to divide 1 by zero 2 4 9 Forme pentru controlul evaluării Cele mai utilizate forme Lisp pentru controlul explicit al evaluării sunt if si cond Forma if poate fi chemată cu doi sau trei parametri În varianta cu trei parametri, evaluarea ei se face astfel: dacă ’e1 >>> ~nil, atunci: (if ’e1 ’e2 e3) >>> e2 altfel: (if ’e1 e2 ’e3) >>> e3 În varianta cu doi parametri, dacă: ’e1 >>> ~nil, atunci: (if ’e1 ’e2) >>> e2 altfel: (if ’e1 e2) >>> nil > (if (zerop (setq x 0)) "eroare" (/ 1 x)) "eroare" > (if (zerop (setq x 2)) "eroare" (/ 1 x)) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 39 1/2 cond este cea mai utilizată formă de control a evaluării Sintactic, ea este formată dintr-un număr de clauze Elementele de pe prima poziŃia a clauzelor se evaluează în secvenŃă până la primul care e diferit de nil În acest moment celelalte elemente ale clauzei de evaluează si cond întoarce valoarea ultimului element din clauză Dacă toate elementele de pe prima poziŃie din clauze se evaluează la nil, atunci cond însusi întoarce nil Dacă ’e11 >>> ~nil, atunci: (cond (’e11 … ’e1n 1) … (ek1 … ekn k)) >>> e1n 1 s a m d , altfel dacă ’ek1 >>> ~nil, atunci: (cond (’e11 … e1n 1) … (’ek1 … ’ekn k)) >>> ekn k altfel: (cond (’e11 … e1n 1) … (’ek1 … ekn k)) >>> nil > (cond ((setq x t) "unu") ((setq x t) "doi") (t "trei")) "unu" > (cond ((setq x nil) "unu") ((setq x t) "doi") (t "trei")) "doi" > (cond ((setq x nil) "unu") ((setq x nil) "doi") (t "trei")) "trei" Cu toată simplitatea ei, forma if are un dezavantaj, si anume faptul că nu permite evaluarea a mai mult decât o singură expresie înainte de iesire SoluŃia o dau formele when si unless Astfel, dacă ’e1 >>> ~nil, atunci: (when ’e1 ’e2 … ’en) >>> en|e2,…,[en] altfel: (when ’e1 e2 … en) >>> nil Similar, dacă ’e1 >>> nil, atunci: (unless ’e1 ’e2 … ’en) >>> en|e2,…,[en] altfel: (unless ’e1 e2 … en) >>> nil 2 4 10 Liste si tabele de asociaŃie Listele de asociaŃie sunt structuri frecvent folosite în Lisp pentru accesul rapid la o dată prin intermediul unei chei Elementele unei liste de asociaŃie sunt celule cons în care părŃile aflate în car se numesc chei si cele aflate în cdr – date Pentru că introducerea si extragerea noilor elemente, de regulă, se face printr-un capăt al listei, ele pot fi făcute să aibă un comportament analog stivelor Într-o astfel de structură, introducerea unei noi perechi cheie-dată cu o cheie identică uneia deja existentă are semnificaŃia „umbririi” asociaŃiei vechi, după cum eliminarea ei poate să însemne revenirea „în istorie” la asociaŃia anterioară Pe acest comportament se bazează, de exemplu, „legarea” variabilelor la valori FuncŃia acons construieste o nouă listă de asociaŃie copiind o listă veche si adăugând o nouă pereche de asociaŃie pe prima poziŃie a acesteia Ea nu modifică lista de asociaŃie Dacă ’l >>> ((e11 e21) (…((e1n e2n) nil)…)), atunci: (acons ’e1 ’e2 ’l) >>> ((e1 e2) ((e11 e21) (…((e1n e2n) nil)…))) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 40 > (setq la (acons 'a 1 nil)) ((A 1)) > (acons 'b 2 la) ((B 2) (A 1)) > (acons 'a 3 la) ((A 3) (A 1)) FuncŃia pairlis organizează o listă de asociaŃie din chei aflate într-o listă si date aflate în alta Nu există o ordine a-priorică de introducere a elementelor în lista de asociaŃie Evident, cele două liste-argument trebuie să aibă aceeasi lungime Dacă ’l1 >>> (e11 (…(e1n nil)…) si ’l2 >>> (e21 (…(e2n nil)…), atunci: (pairlis ’l1 ’l2) >>> ((e11 e21) (…((e1n e2n) nil)…)) > (pairlis (list ’a ’b ’c) (list 1 2 3)) ((C 3) (B 2) (A 1)) Dacă apare si un al treilea argument, care trebuie să fie o listă de asociaŃie, introducerea noilor elemente se face în faŃa celor deja existente în această listă FuncŃiile asooc si rassoc sunt funcŃii de acces într-o listă de asociaŃie – assoc folosind cheia pentru identificarea elementului căutat, iar rassoc – data Dacă: ’l >>> ((e11 e21) (…((e1k e2k) (…((e1n e2n) nil)…))…)), si (e1k e2k) este prima pereche cheie-dată din lista de asociaŃie în care apare e1k pe poziŃia cheii, atunci: (assoc ’e1k ’l) >>> (e1k e2k) Pentru aceeasi listă de asociaŃie, dacă (e1k e2k) este prima pereche cheiedată din lista de asociaŃie în care apare e2k pe poziŃia datei, atunci: (rassoc ’e2k ’l) >>> (e1k e2k) > (setq vals (pairlis (list 'a 'b 'a) (list 1 2 3))) ((A 3) (B 2) (A 1)) > (assoc 'a vals) (A 3) > (rassoc 1 vals) (A 1) În mod implicit, testul de identificare a cheii sau a datei, se face cu funcŃia eql Dacă însă se doreste un alt tip de identificare, atunci o funcŃională (care trebuie să aibă exact doi parametri) poate fi anunŃată, prin cuvântul cheie :test Astfel, dacă ’l >>> ((e11 e21) (…((e1k e2k) (…((e1n e2n) nil)…))…)) si e1k este prima apariŃie pe poziŃia cheii care satisface (f ’e e1k) >>> t, cu f o funcŃională care necesită exact doi parametri, atunci: (assoc ’e ’l :test #’f) >>> (e1k e2k) În aceleasi condiŃii pentru argumentul ’l, dar cu funcŃionala satisfăcând (f ’e e2k) >>> t: (rassoc ’e ’l :test #’f) >>> (e1k e2k) > (rassoc 2 vals :test #'>) (A 1) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 41 Exemplul probează si ordinea în care se transmit argumentele funcŃionalei: ca prim argument al funcŃionalei este considerat primul argument al funcŃiei assoc sau rassoc, iar ca cel de al doilea argument – pe rând câte o cheie, respectiv, o dată din lista de asociaŃie 2 4 11 LocaŃii si accese la locaŃii Forma setf accesează o locaŃie, pentru completarea ei prin intermediul unei funcŃionale care, în mod uzual, solicită o valoare depozitată în acea locaŃie setf, asadar, inversează comportamentul funcŃionalei pe care o primeste ca prim argument, care, în loc de a extrage o valoare deja depozitată într-o locaŃie, va deschide calea pentru a se memora acolo o valoare Dacă ’f1 >>> ea, … , ’fn >>> ez atunci: (setf ’f1 ’e1 … ’fn ’en) >>> en|’f1 >>> e1, … , ’fn >>> en > (setq l '(a b c)) (A B C) > (setf (car l) 1 (cadr l) 'beta) BETA > l (1 BETA C) Oricare dintre următoarele funcŃionale poate fi utilizată ca prim argument: toate funcŃiile c r, nth Alte funcŃionale vor fi adăugate la această listă pe măsură ce vor fi introduse 2 4 12 Lista de proprietăŃi a unui simbol Unui simbol i se poate asocia o listă de perechi proprietate-valoare, în care proprietăŃile sunt simboluri, iar valorile – date Lisp În această listă o proprietate poate să apară o singură dată O listă de proprietăŃi are asemănări cu o listă de asociaŃie (astfel numele de proprietate corespunde cheii, iar valoarea proprietăŃii – datei) dar există si diferenŃe între ele (în lista de proprietăŃi o singură valoare poate fi atribuită unei proprietăŃi, dar mai multe în lista de asociaŃie, ce pot fi regăsite în ordinea inversă a atribuirilor) ImplementaŃional, o listă de proprietăŃi a unui simbol este o listă de lungime pară, în care pe poziŃiile impare sunt memorate (cu unicitate) numele proprietăŃilor si alături de ele, pe poziŃiile pare, – valorile acestora Cercetarea valorii unei proprietăŃi a unui simbol se face prin funcŃia get: dacă lista de proprietăŃi a simbolului s este: (s1 (e1 (…(sn (en nil))…))), atunci, dacă sk Î{s1,…,sn}: (get ’s ’sk) >>> ek altfel: (get ’s ’sk) >>> nil În cazul în care un al treilea argument e specificat, atunci el indică valoarea care se doreste să înlocuiască valoarea implicit întoarsă nil atunci când proprietatea solicitată nu a fost setată: dacă sk Ï{s1,…,sn}: (get ’s ’sk ’e) >>> e Cristea, IoniŃă, Pistol – InteligenŃa Artificială 42 Atribuirea valorii unei proprietăŃi a unui simbol se face printr-un apel setf în care pe poziŃia funcŃionalei se foloseste get: > (setf (get 'a 'p1) 'v1) V1 > (setf (get 'a 'p2) 'v2) V2 > (get 'a 'p1) V1 > (get 'a 'p2) V2 FuncŃia remprop îndepărtează o valoare pe de o proprietate a unui simbol Astfel, dacă lista de proprietăŃi a simbolului s este: l=(s1 (e1 (…(sk (ek (…(sn (en nil))…)))…))), astfel încât: (get ’s ’sk) >>> ek atunci: (remprop ’s ’sk) >>> ~nil | l(s1 (e1 (…(sn (en nil))…))) FuncŃia symbol-plist întoarce lista de proprietăŃi a unui simbol: Dacă lista de proprietăŃi a simbolului s este: (s1 (e1 (…(sn (en nil))…))), atunci: (symbol-plist ’s) >>> (s1 (e1 (…(sn (en nil))…))) > (setf (get 'a 'p1) 'v1) V1 > (setf (get 'a 'p2) 'v2) V2 > (symbol-plist 'a) (P2 V2 P1 V1) 2 4 13 FuncŃii chirurgicale FuncŃiile chirurgicale îsi justifică numele prin faptul că realizează modificări asupra argumentele Ele sunt asadar funcŃii în care efectul lateral este cel care primează FuncŃia nconc modifică toate argumentele (fiecare de tip listă) cu excepŃia ultimului, realizând o listă din toate elementele listelor componente Astfel, dacă: l1 = (e11 (…(e1k 1 nil)…)),… ln-1 = (en-1,1 (…(en-1,k n-1 nil)…)), ln = (en1 (…(enk n nil)…)) atunci: (nconc 'l1 … 'ln-1 'ln) >>> (e11 (…(e1k 1 (…(en-1,1 (…(en-1,k n-1 (en1 (…(enk n nil)…)))…))…))…)) | l1 >>> (e11 (…(e1k 1 (…(en1 (…(enk n nil)…)…)…) ,… ln-1 >>> (en-1,1 (…(en-1,k n-1 (en1 (…(enk n nil)…)))…)) NotaŃia pune în evidenŃă faptul că primele n-1 argumente, din cele n ale apelului, vor rămâne modificate în urma apelului Cristea, IoniŃă, Pistol – InteligenŃa Artificială 43 > (setq x '(a b c)) (A B C) > (setq y '(1 2 3)) (1 2 3) > (setq z '(u v)) (U V) > (nconc x y z) (A B C 1 2 3 U V) > X (A B C 1 2 3 U V) > y (1 2 3 U V) > z (U V) FuncŃia rplaca modifică car-ul celulei cons obŃinută din evaluarea primului argument la valoarea celui de al doilea argument si întoarce celula cons modificată Dacă: l = (e1 e2), atunci: (rplaca ’l ’e) >>> (e e2) | l = (e e2) > (setq x ‘(a b c)) (A B C) > (rplaca (cdr x) ‘d) (D C) > x (A D C) FuncŃia rplacd modifică cdr-ul celulei cons obŃinută din evaluarea primului argument la valoarea celui de al doilea argument si întoarce celula cons modificată Dacă: l = (e1 e2), atunci: (rplacd ’l ’e) >>> (e1 e) | l = (e1 e) > (setq x ‘(a b c)) (A B C) > (rplacd (cdr x) ‘d) (B D) > x (A B D) Următorul exemplu probează că un apel append copiază toate elementele listelor argument cu excepŃia ultimului: > (setq x '(a b c) y '(d e)) (D E) > (setq z (append x y)) (A B C D E) > (rplaca x 'alpha) (ALPHA B C) > z (A B C D E) > (rplaca y 'beta) (BETA E) > z (A B C BETA E) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 44 2 4 14 Forme de apelare a altor funcŃii FuncŃia apply cheamă o funcŃie asupra unei liste de argumente > (setq f '+) + > (apply f '(1 2 3)) 6 > (apply #'+ '()) 0 > (apply #'min '(2 -6 8)) -6 FuncŃia funcall aplică o funcŃie asupra unor argumente > (cons 1 2) (1 2) > (setq cons (symbol-function '+)) # > (funcall cons 1 2) 3 > (funcall #'max 1 2 3 4) 4 > (setq x 2) 2 > (funcall (if (> x 0) #'max #'min) 1 2 3 4) 4 > (setq x -2) -2 > (funcall (if (> x 0) #'max #'min) 1 2 3 4) 1 2 4 15 Lambda expresii O lambda-expresie atasează unui set de parametri formali un corp de funcŃie O lambda-expresie poate fi folosită în locul unui nume de funcŃie: ((lambda (s1… sk) ec1… ecn) ’ep1… ’epk) >>> ecn | s1ep1,…, skepk, ec1,…, [ecn], unbind(s1,…, sk) Proceduri uzuale de apel sunt: ca prim argument al unei liste supusă evaluării, sau prin intermediul funcŃiilor apply, funcall ori map (a se vedea secŃiunea următoare) La evaluare, mai întâi argumentele formale ale lambdadefiniŃiei (s1…sk) se leagă la valorile actuale evaluate (ep1…epk), apoi formele corpului definiŃiei (’ec1…’ecn) sunt evaluate una după alta Valoarea întoarsă este cea rezultată din evaluarea ultimei forme Lambda-definiŃia marchează un context (domeniu) lexical (discutat în secŃiunea 2 5 5 Variabile si domeniile lor) pentru variabilele locale > ((lambda(x y) (> x y)) 3 2) T Cristea, IoniŃă, Pistol – InteligenŃa Artificială 45 2 4 16 Lambda-funcŃii recursive6 Nu putem utiliza o lambda definiŃie pentru o funcŃie recursivă pentru că lambda-funcŃia nu are nume Pentru a asocia nume funcŃiilor definite ca lambdaexpresii se foloseste construcŃia labels Forma unui apel este: (labels ( *) *) în care fiecare dintre specificaŃiile de legare trebuie să aibă forma: ( ) adică analog unei definiŃii lambda În interiorul expresiilor din labels, va referi acum o funcŃie ca după un apel: #'(lambda ) > (labels ((inc (x) (1+ x)))(inc 3)) 4 În exemplul următor primul argument al lui mapcar este o funcŃie recursivă: > (defun count-instances (obj lsts) (labels ((instances-in (lst) (if (consp lst) (+ (if (eq (car lst) obj) 1 0) (instances-in (cdr lst))) 0))) (mapcar #'instances-in lsts))) COUNT-INSTANCES > (count-instances 'a '((a b c) (d a r p a) (d a r) (a a))) (1 2 1 2) FuncŃia primeste un obiect si o listă si întoarce o listă a numărului de apariŃii a obiectului în fiecare element al listei > (labels((dot-product (a b) (if (or (null a)(null b)) 0 (+ (* (car a)(car b)) (dot-product (cdr a)(cdr b)))))) (dot-product '(1 2 3) '(10 20 30))) 140 Apelul de mai sus cuprinde o definiŃie recursivă a produsului scalar al doi vectori (daŃi ca liste) 2 4 17 FuncŃii de corespondenŃă Din această categorie fac parte funcŃii care aplică o funcŃională asupra argumentelor construite din listele primite ca parametri FuncŃiile de corespondenŃă, 6 Exemplele din această secŃiune sînt preluate din (Graham, 1994) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 46 exersate corect, formează deprinderea de a gândi transformări aplicate unei mulŃimi de obiecte, de o manieră globală, iar nu ca iterări asupra elementelor mulŃimii Mapcar aplică o funcŃie asupra elementelor unor liste: dacă ’l1 >>> (e11 (…(e1k 1 nil)…)),… ’ln >>> (en1 (…(enk n nil)…)) si f este o funcŃională de n argumente (asadar aritatea funcŃionalei este egală cu numărul listelor comunicate ca parametri) si dacă lungimea celei mai mici liste argument este k (k = min (k 1,… , k n)), atunci: (mapcar ’f ’l1 … ’ln) = (list (funcall #’f ’e11 … ’en1) … (funcall #’f ’e1k … ’enk)) cu alte cuvinte, valoarea întoarsă de mapcar va fi o listă de lungime k, în care fiecare element de rang j (jÎ{1,…, k}) reprezintă valoarea întoarsă de evaluarea funcŃionalei f asupra elementelor de rang j din fiecare din listele din intrare (v si Figura 2 5) > (mapcar 'equal '(a (b c) d e) '(b (b c) f e 3)) (NIL T NIL T) Următorul apel realizează produsul scalar al doi vectori7 daŃi ca liste de numere: > (apply #'+ (mapcar #'* '(1 2 3) '(10 20 30))) 140 Următoarea secvenŃă intenŃionează să înlocuiască nume de persoane cu diminutivele lor întrun text dat: > (setq l (pairlis '(Mihai Gheorghe Nicolae Ion) '(Misu Ghita Nicu Ionica))) ((ION IONICA) (NICOLAE NICU) (GHEORGHE GHITA) (MIHAI MISU)) > (mapcar #'(lambda(x) (if (null (assoc x l)) x (cdr (assoc x l)))) '(Mihai s-a intilnit cu Mircea ca sa-l viziteze impreuna pe Ion)) (MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) 7 Produsul scalar al doi vectori de numere este numărul egal cu suma produselor elementelor de acelasi rang din cei doi vectori: dacă v1=(a1,…,an), v2=(b1,…,bn), atunci v1 v2=a1*b1 +…+ an*bn Cristea, IoniŃă, Pistol – InteligenŃa Artificială 47 Figura 2 5: Evaluarea în cazul unui apel mapcar Figura 2 6: Evaluarea în cazul unui apel maplist Această implementare suferă de un defect: execuŃia este ineficientă pentru că asocierea unui nume într-o listă este făcută de două ori Vom corecta această deficienŃă în secŃiunea dedicată formei let Maplist – funcŃionează asemănător cu mapcar, numai că funcŃionala este aplicată listelor si cdr-urilor succesive ale acestora, în secvenŃă: > (maplist #'(lambda (x) x) '(1 2 3 4)) ((1 2 3 4) (2 3 4) (3 4) (4)) > (mapcar #'(lambda (x) (cons 'alpha x)) (maplist #'(lambda (x) x) '(1 2 3 4))) ((ALPHA 1 2 3 4) (ALPHA 2 3 4) (ALPHA 3 4) (ALPHA 4)) > (mapcar #'(lambda (x) (apply #'+ x)) (maplist #'(lambda (x) x) '(1 2 3 4))) (10 9 7 4) (mapcar ’f ’l1 … ’ln) en1 en2 … enk e11 e12 … e1k (f … ) (f … ) (f … )      e1 e2 … ek dimensiunea iesirii = lungimea listei minime numărul argumentelor = aritatea funcŃionalei (maplist #’f ’l1 … ’ln) l1 (cdr l1) … (cdr(…(cdr l1)…)      e1 e2 … ek dimensiunea iesirii = lungimea listei minime numărul argumentelor = aritatea funcŃionalei ln (cdr ln) … (f … ( c d r ( … ( c d r l n) … ) ) (f … ) (f … ) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 48 2 5 Tehnici de programare în Lisp 2 5 1 DefiniŃii de funcŃii DefiniŃia unei funcŃii se face cu construcŃia defun: (defun s (s1… sk) e1… en) >>> s | s(lambda(s1… sk) e1… en) Asadar, rezultatul unei definiŃii de funcŃii este crearea unei legări între un nume, recunoscut global, – s, o listă de variabile, considerate variabile formale ale funcŃiei, – s1… sk si un corp al funcŃiei – secvenŃa e1… ek Desi neuzuală, este permisă, desigur, definirea de funcŃii în interiorul altor funcŃii O funcŃie definită în interiorul altei funcŃii devine cunoscută sistemului însă numai după apelarea cel puŃin o dată a funcŃiei în care a fost ea definită: > (defun f1 () (princ "f1")) F1 > (defun f2() (defun f3() (princ "f3")) (princ "f2")) F2 > (f1) f1 "f1" > (f2) f2 "f2" > (f3) f3 "f3" > (defun f4() (defun f5() (princ "f5")) (princ "f4")) F4 > (f5) Error: attempt to call `F5' which is an undefined function [condition type: UNDEFINED-FUNCTION] > (f4) f4 "f4" > (f5) f5 "f5" 2 5 2 Recursivitate În Lisp recursia este la ea acasă Iată definiŃia funcŃiei factorial: > (defun fact (n) (if (zerop n) 1 (* n (fact (1- n))))) O strategie, care nu dă gres, de definire a funcŃiilor recursive zice asa: - începe prin a scrie condiŃia de oprire; - scrie apoi apelul recursiv > (defun fact (n) (if (zerop n) 0 (* n (fact (- n 1))))) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 49 FACT Orice argument, oricât de mare, poate fi dat acestei funcŃii: >(fact 1000) 402387260077093773543702433923003985719374864210714632543799910429938 512398629020592044208486969404800479988610197196058631666872994808558 901323829669944590997424504087073759918823627727188732519779505950995 276120874975462497043601418278094646496291056393887437886487337119181 045825783647849977012476632889835955735432513185323958463075557409114 262417474349347553428646576611667797396668820291207379143853719588249 808126867838374559731746136085379534524221586593201928090878297308431 392844403281231558611036976801357304216168747609675871348312025478589 320767169132448426236131412508780208000261683151027341827977704784635 868170164365024153691398281264810213092761244896359928705114964975419 909342221566832572080821333186116811553615836546984046708975602900950 537616475847728421889679646244945160765353408198901385442487984959953 319101723355556602139450399736280750137837615307127761926849034352625 200015888535147331611702103968175921510907788019393178114194545257223 865541461062892187960223838971476088506276862967146674697562911234082 439208160153780889893964518263243671616762179168909779911903754031274 622289988005195444414282012187361745992642956581746628302955570299024 324153181617210465832036786906117260158783520751516284225540265170483 304226143974286933061690897968482590125458327168226458066526769958652 682272807075781391858178889652208164348344825993266043367660176999612 831860788386150279465955131156552036093988180612138558600301435694527 224206344631797460594682573103790084024432438465657245014402821885252 470935190620929023136493273497565513958720559654228749774011413346962 715422845862377387538230483865688976461927383814900140767310446640259 899490222221765904339901886018566526485061799702356193897017860040811 889729918311021171229845901641921068884387121855646124960798722908519 296819372388642614839657382291123125024186649353143970137428531926649 875337218940694281434118520158014123344828015051399694290153483077644 569099073152433278288269864602789864321139083506217095002597389863554 277196742822248757586765752344220207573630569498825087968928162753848 863396909959826280956121450994871701244516461260379029309120889086942 028510640182154399457156805941872748998094254742173582401063677404595 741785160829230135358081840096996372524230560855903700624271243416909 004153690105933983835777939410970027753472000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000 > Abia un argument exagerat de mare, de genul: >(fact (fact 1000)) ne poate cauza neplăceri (atunci când interpretorul utilizat nu este unul comercial): Error: An allocation request for 1080 bytes caused a need for 2883584 more bytes of heap This request cannot be satisfied because you have hit the Allegro CL Trial heap limit [condition type: STORAGECONDITION] Cristea, IoniŃă, Pistol – InteligenŃa Artificială 50 Recursivitate coadă8 Se spune că o funcŃie este coadă-recursivă dacă, după apelul recursiv, nu mai are nimic de făcut Următoarea funcŃie e coadă-recursivă: > (defun our-find-if (fn lst) (if (funcall fn (car lst) (car lst) (our-find-if fn (cdr lst)))) pentru că funcŃia întoarce direct valoarea apelului recursiv Următoarele funcŃii nu sunt coadă-recursivă: > (defun our-length (lst) (if (null lst) 0 (1+ (our-length (cdr lst))))) > (defun suma (lst) (if (null lst) 0 (+ (car lst) (suma (cdr lst))))) pentru că rezultatul apelului recursiv este transferat, într-un caz lui 1+ si, în celălalt caz, funcŃiei de adunare + Nici funcŃia factorial, definită mai sus, nu e coadărecursivă Recursivitatea coadă este căutată pentru că multe compilatoare Common Lisp pot transforma funcŃii coadă-recursive în bucle (iteraŃii) O funcŃie care nu e coadă-recursivă poate adesea fi transformată într-una care e coadă recursivă prin scufundarea în ea a unei alte funcŃii ce conŃine un argument acumulator (ce păstrează valoarea calculată până la un moment dat) Scrierea funcŃiilor cu recursivitate coadă prin parametru acumulator Următoarea funcŃie întoarce lungimea unei liste: > (defun tail-length (lst acc) (if (null lst) acc (tail-length (cdr lst) (1+ acc)))) FuncŃia de adunare a elementelor unei liste, de mai sus, scrisă în varianta cu registru acumulator: > (defun suma1 (lst ac) (if (null lst) ac (suma1 (cdr lst) (+ ac (car lst))))) > (suma1 '(1 2 3 4 5) 0) 0 : (SUMA1 (1 2 3 4 5) 0) 1 : (SUMA1 (2 3 4 5) 1) 2 : (SUMA1 (3 4 5) 3) 3 : (SUMA1 (4 5) 6) 4 : (SUMA1 (5) 10) 8 O parte din exemplele acestei secŃiuni sînt preluate din (Graham, 1994) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 51 5 : (SUMA1 NIL 15) 5 : returned 15 4 : returned 15 3 : returned 15 2 : returned 15 1 : returned 15 0 : returned 15 15 Apelul acestei funcŃii trebuie încapsulat într-un alt apel care să iniŃializeze acumulatorul: > (defun suma (lst) (suma1 lst 0)) Acelasi lucru poate fi însă realizat cu ajutorul lui labels astfel încât funcŃia recursivă să fie ascunsă în interiorul alteia care nu afisează argumentul acumulator În acest fel "bucătăria" apelului recursiv nu se manifestă la suprafaŃă: > (defun our-length (lst) (labels ((rec (lst acc) (if (null lst) acc (rec (cdr lst) (1+ acc))))) (rec lst 0))) 2 5 3 Forme de secvenŃiere progn este o formă al cărei scop este pur si simplu acela de a evalua într-o secvenŃă o succesiune de forme Lisp în vederea întoarcerii ultimei valori: (progn ’e1… ’en) >>> en | e1,…,[en] prog1 se comportă la fel ca progn, cu deosebirea că valoarea întoarsă este cea a primei forme din cuprinderea sa: (prog1 ’e1… ’en) >>> e1 | [e1],…,en Utilizând formele progn si prog1 se pot realiza mai multe evaluări în contexte sintactice în care doar o singură formă este permisă (ca de exemplu, toate cele trei poziŃii ale argumentelor formei if) Este clar că rostul utilizării unui prog1 într-o definiŃie de funcŃie este acela de a întoarce o valoare înainte efectuării unor evaluări care sunt importante numai prin efectele lor laterale 2 5 4 Formele speciale let si let* Forma let oferă un mijloc de a defini variabile a căror semnificaŃie să fie aceeasi într-o anumită întindere de program Rostul ei este, asadar, de a defini domenii lexicale si de a preciza legări (despre domenii vom vorbi pe larg în secŃiunea următoare) Cel mai frecvent tip de apel al formei let are forma: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 52 (let ((s1 ’ei1)…(sn ’ein)) ’ec1…’eck) >>> eck | ei1,…,ein, s1ei1‖…‖ snein,ec1,…,[eck],unbind(s1,…,sn) În acest apel, s1…sn sunt variabile locale, ’ei1…’ein sunt expresii care, evaluate, configurează valorile iniŃiale pe care le iau variabilele înainte de evaluarea în secvenŃă a expresiilor ’ec1…’eck Valoarea întoarsă de let este cea a ultimei expresii, eck DefiniŃia de mai sus caută să surprindă, în secŃiunea de efecte laterale, secvenŃa evaluărilor, cu precădere faptul că evaluarea secvenŃei ’ec1…’eck se face în contextul iniŃial al legărilor variabilelor s1,…,sn la valorile iniŃiale ei1,…,ein, legările fiind făcute în paralel după ce valorile iniŃiale au fost evaluate serial Aceste legări sunt însă „uitate” la iesirea din formă Într-adevăr, dincolo de graniŃa acestei construcŃii, semnificaŃia variabilelor locale, ca si legările realizate, se pierd NotaŃia noastră mai comunică si ideea că valoarea întoarsă este într-adevăr acel eck, obŃinut la un anumit moment în secvenŃa evaluărilor, după care contextul legărilor este uitat Legarea simultană a variabilelor la valori face posibilă schimbarea între ele a valorilor a două variabile fără intermediul unei a treia variabile care să memoreze temporar valoarea uneia dintre ele: > (let ((x ’a)(y ’b)) (prin1 x) (prin1 y) (let ((x y)(y x)) (prin1 x) (prin1 y))) ABBA A Folosind forma let putem eficientiza soluŃia exerciŃiului cu diminutive dat mai sus: > (mapcar #'(lambda(x) (let ((temp (assoc x l))) (if (null temp) x (cdr temp)))) '(Mihai s-a intilnit cu Mircea ca sa-l viziteze impreuna pe Ion)) (MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) Forma let* este similară formei let, cu deosebirea că legarea variabilelor la valori este făcută serial Cel mai frecvent tip de apel al formei let* are forma: (let* ((s1 ’ei1)… (sn ’ein)) ’ec1…’eck) >>> eck | ei1,s1ei1, …, ein,snein,ec1,…,[eck],unbind(s1),…,unbind(sn) Desigur, cu let* rezultatul permutării de valori de mai sus nu se mai păstrează: > (let ((x ’a)(y ’b)) (prin1 x) (prin1 y) (let* ((x y)(y x)) (prin1 x) (prin1 y))) ABBB B Exemplele care urmează pun în evidenŃă diverse domenii create cu let si let*: > (let ((x 1)) (prin1 x) (let ((x 2)(y x)) (prin1 x)(prin1 y)) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 53 (prin1 x)) 1211 1 > (let ((x 1)) (prin1 x) (let* ((x 2)(y x)) (prin1 x)(prin1 y)) (prin1 x)) 1221 1 2 5 5 Variabile si domeniile lor În Lisp noŃiunea de variabilă, atât de comună în alte limbaje de programare, înŃeleasă ca asocierea dintre un nume simbolic, un tip si un spaŃiu de memorie unde poate fi depozitată o valoare, trebuie privită oarecum diferit Vom continua să numit variabilă un simbol care apare în codul programului cu intenŃia ca lui să i se asocieze valori Mai întâi, asa cum am arătat deja (v secŃiunea 2 3 Tipuri de date în Lisp), variabilele nu au tipuri Apoi, nu este cazul ca o variabilă să definească un spaŃiu de memorie care să fie ocupat de o valoare Aici, simbolului care dă numele variabilei i se poate asocia o valoare Un număr de fome ale Lisp-ului (printre ele: defun, lambda, let, let*, do, dolist, dotimes etc , adică acele forme ce permit definirea de parametri locali) creează domenii (sau întinderi) ale variabilelor ce apar pe post de parametri locali în aceste forme Un domeniu este un spaŃiu lexical contiguu, mărginit de perechea de paranteze care „îmbracă” o formă, ce evidenŃiază o listă de parametri locali La orice moment funcŃionează următoarea regulă de legare: valoarea unei variabile este dictată de ultima legare ce a avut loc în cel mai adânc domeniu care cuprinde variabila în lista de parametri locali ai săi Dacă nu există nici un domeniu care să numere variabila printre parametrii săi atunci variabila e considerată globală si legarea se face în domeniul de adâncime zero, cel al expresiilor evaluate la prompter Astfel, în Figura 2 7 sunt schiŃate trei domenii, în afara celui global (considerat de adâncime zero): cel exterior (sau de adâncime unu), notat cu A, care defineste ca locale variabilele x, u si w, si două domenii de adâncime doi, notate B si respectiv C, care au ca variabile locale, B pe x si y ,iar C pe x, z si u În contextul domeniului B valorile variabilelor referite sunt: pentru x si y – cele legate în acest context, pentru u – cea legată în contextul A si pentru z – cea definită în contextul global În contextul domeniului A, în continuare sunt referite variabilele: x – cu valoarea legată în contextul A si v – cu valoare globală În sfârsit, în domeniul C sunt referite variabilele: x, z si u – cu valorile date de legările domeniului C, si w – cu legarea din contextul domeniului A O variabilă care nu este definită ca locală într-un domeniu se spune că este liberă în acel domeniu Astfel, de exemplu, domeniul A conŃine variabila liberă v, domeniul B – variabilele u si y, iar domeniul C – variabila w Figura 2 7: Domenii lexicale incluse (x,u,w) x,v A (x,y) x,y,u,z B (x,z,u) x,z,u,w C Cristea, IoniŃă, Pistol – InteligenŃa Artificială 54 Teoretic, există două modalităŃi prin care putem să asociem o valoare unei variabile ce nu este parametru local al unei funcŃii: prin legare statică si prin legare dinamică În legarea statică, valoarea unei astfel de variabile este stabilită de contextul lexical (întinderea de program) în care este ea folosită, pe când în legarea dinamică atribuirea valorii rezultă în urma execuŃiei O valoare a unei variabile legată lexical poate fi referită numai de forme ce apar textual în interiorul construcŃiei ce a produs legarea O astfel de legare impune asadar o limitare spaŃială, iar nu una temporală, a domeniului unde referinŃa se poate realiza în siguranŃă Dimpotrivă, o valoare a unei variabile legată dinamic poate fi referită în siguranŃă în toate momentele ulterioare legării pe parcursul evaluării formei în care a fost efectuată legarea Ca urmare ea impune o limitare temporală asupra apariŃiei referinŃelor iar nu una spaŃială Tipul de legare considerat implicit în Common Lisp este cea statică, desi nu întotdeauna lucrurile au stat asa Într-adevăr în multe implementări anterioare ale Lisp-ului (ca de exemplu, realizările românesti DM-LISP (Giumale et al , 1987) si TC-LISP (Tufis, 1987) (Tufis, Popescu, 1987)) se optase pentru o legare dinamică Legarea statică este o trăsătură a majorităŃii limbajelor moderne si ea asigură o mai mare rezistenŃă la erori programelor O strategie de legare în care valorile atribuite variabilelor să depindă de firul curent al execuŃiei a constituit, la un moment dat, o alternativă de implementare atrăgătoare, din cauza posibilităŃilor mai bogate, aproape exotice, de comunicare a valorilor variabilelor în timpul execuŃiei, pe care această opŃiune le oferea ExperienŃa a arătat însă că un astfel de comportament predispunea la erori si, ca urmare, standardul Common Lisp, fără a-l invalida, nu îl recomandă El poate fi ales explicit de utilizator printr-o declaraŃie special (v cap 9 Declarations în (Steele, 1990)) > (defun F1() (let ((x 'a)) (defun F2() (prin1 x) ) ) ) F1 > (F1) F2 > (let ((x 'b))(F2)) A A Exemplul doreste să evidenŃieze cele două posibilităŃi de legare ale variabilei x DefiniŃia funcŃiei F1 cuprinde o legare a simbolului x la valoarea a urmată de o definiŃie a funcŃiei F2, în care valoarea lui x este tipărită Corpul definiŃiei funcŃiei F2 creează un domeniu pentru x În F2 variabila x nu este parametru formal si deci aici nu avem un nou domeniu pentru x DefiniŃia funcŃiei F2 are loc odată efectuat apelul lui F1 Mai departe are loc apelul lui F2 într-un context în care x este legată la valoarea b (domeniu precizat de forma let, ce va fi prezentată în secŃiunea următoare) Un comportament tipic legării dinamice ar trebui să producă tipărirea valorii B, pentru că simbolul x era legat la această valoare înainte de apelul funcŃiei F2 în care are loc tipărirea Faptul că valoarea tipărită este însă A semnalează un Cristea, IoniŃă, Pistol – InteligenŃa Artificială 55 comportament tipic legării statice, adică unul în care simbolul x din contextul formei let este „altul” decât cel din corpul definiŃiei lui F2 Pentru alt exemplu v si (Graham, 1994), p 16 2 5 6 Legări versus asignări Chestiunile discutate până acum probează că există două maniere în care o variabilă poate căpăta o valoare: prin legare (exemplu: let) si prin asignare (exemplu: setq) Orice construcŃie care leagă o variabilă la o nouă valoare salvează vechea valoare, dacă noul domeniu este inclus într-unul vechi, astfel încât la iesirea din construcŃia care a produs noua legare variabila revine la vechea valoare Exemplul următor lămureste: > (let ((x 'a)) (prin1 x) (let ((x 'b)) (prin1 x)) (prin1 x)) ABA A > (let ((x 'a)) (prin1 x) (let () (setq x 'b) (prin1 x)) (prin1 x)) ABB B > (let ((x 'a)) (prin1 x) (let ((x 'b)) (setq x 'c) (prin1 x)) (prin1 x)) ACA A În primul exemplu, avem două domenii incluse unul în altul, pentru variabila x În domeniul exterior x se leagă la valoarea A, la intrarea în domeniul interior x se leagă la valoarea B, iar la iesirea din acesta revine la vechea valoare – B În exemplul al doilea, x este liber în domeniul interior, dar îi este asignată acolo valoarea B La iesirea din acest domeniu, care nu este al său, e normal ca x să păstreze această valoare În al treilea exemplu, x este legat din nou în ambele domenii si, ulterior legării interioare la valoarea B, îi este asignată o a treia valoare – C La revenirea în domeniul exterior, x recapătă valoarea la care era legat acolo – A Valoarea pe care o poate avea o variabilă când nu s-a realizat nici o legare explicită a ei se consideră globală O valoare globală poate fi dată numai prin asignare DefiniŃie Un simbol s apare liber într-o expresie când e folosit ca variabilă în acea expresie dar expresia nu creează o legare pentru el Astfel, în exemplul următor, w, x si z apar libere în list iar w si y apar libere în let: (let ((x y) (z 10)) (list w x z)) Despre o variabilă care este liberă într-un domeniu, precum si în toate domeniile care-l înglobează pe acesta, si care nu are asignată o valoare în domeniul global vom spune că e nelegată (unbound) În secŃiunea 2 4 2 Asignarea unei valori unui simbol discutam modalităŃi diferite de interpretare a unei notaŃii de genul x:=y Aparent cea mai simplă, prima interpretare discutată este în realitate cea mai subtilă: ea dorea ca variabila x să primească valoarea pe care o are variabila y, după care ele să aibă „vieŃi” separate, Cristea, IoniŃă, Pistol – InteligenŃa Artificială 56 în sensul că orice modificări efectuate asupra uneia să nu se resfrângă si asupra celeilalte Să observăm că nici asignarea simplă, de genul (setq x y), si nici legarea, de genul (let* ((y )(x y)) ) nu realizează acest deziderat pentru că există pericolul ca modificările asupra uneia dintre variabile să fie rezultatul intervenŃiei unei funcŃii chirurgicale (v secŃiunea 2 4 13 FuncŃii chirurgicale), caz în care ea ar fi resimŃită de ambele variabile Am avea asadar cel de al doilea comportament comentat, care este unul în care cele două variabile devin „surori siameze” Pentru a realiza primul efect este necesară copierea valorii simbolului y ca valoare a lui x Common-Lisp dispune de mai multe funcŃii de copiere Astfel dacă y este o listă, putem scrie: (setq x (copy-list y)) În ultima interpretare variabilei x i se atribuie ca valoare însusi simbolul y: (setq x ’y) 2 5 7 Forme de iterare dolist iterează aceleasi evaluări asupra tuturor elementelor unei liste Dacă l = (e1 (…(ek nil)…)), atunci: (dolist (s ’l ’e) ’ec1… ’ecn) >>> e | se1,ec1,…,ecn,…,sek, ec1,…,ecn,[e],unbind(s) > (dolist (x '(a b c d) 'exit) (prin1 x) (princ " ") ) A B C D EXIT Într-o altă formă a apelului, valoarea întoarsă poate fi ignorată: (dolist (s ’l) ’ec1… ’ecn) >>> nil | se1,ec1,…,ecn,…,sek, ec1,…,ecn,[nil],unbind(s) dotimes iterează aceleasi evaluări de un număr anumit de ori: Dacă n>0, atunci: (dotimes (s ’n ’e) ’ec1…’ecn) >>> e | s0,ec1,…,ecn,…, sn-1,ec1,…,ecn,sn,[e],unbind(s) > (dotimes (x 4 x) (prin1 x) (princ " ") ) 0 1 2 3 4 NIL Într-o altă formă a apelului, valoarea întoarsă poate fi ignorată: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 57 (dotimes (s ’n) ’ec1…’ecn) >>> nil | s0,ec1,…,ecn,…, sn-1,ec1,…,ecn,[nil],unbind(s) Forma do reprezintă maniera cea mai generală de a organiza o iteraŃie în Lisp Ea permite utilizarea unui număr oarecare de variabile si controlarea valorilor lor de la un pas al iteraŃiei la următorul Forma cea mai complexă a unui apel do este: (do ((s1 ’ei1 ’es1)… (sn ’ein ’esn)) (’et ’er1… ’erp) ’ec1… ’ecq) >>> erp | ei1,…,ein,s1ei1‖…‖ snein, while(not et) {ec1,…,ecq,es1,…,esn,s1es1‖…‖ snesn},er1,…,[erp], unbind(s1,…,sn) Primul element al formei este o listă definind variabilele de control ale buclei, valorile lor de iniŃializare si de incrementare Astfel, fiecărei variabile îi corespunde o listă formată din numele variabilei, eventual valoarea iniŃială si, când aceasta apare, eventual o formă de incrementare a pasului Dacă expresia de iniŃializare e omisă, ea va fi implicit considerată nil Dacă expresia de incrementare este omisă, variabila nu va fi schimbată între pasii consecutivi ai iteraŃiei (desi corpul lui do poate modifica valorile variabilei prin setq) Înainte de prima iteraŃie, toate formele de iniŃializare sunt evaluate si fiecare variabilă este legată la valoarea de iniŃializare corespunzătoare (acestea sunt legări iar nu asignări, astfel încât după iesirea din iteraŃie, variabilele revin la valorile la care erau legate înainte de intrarea în iteraŃie) La începutul fiecărei iteraŃii, după procesarea variabilelor, o expresie de test et este evaluată Dacă rezultatul este nil, execuŃia continuă cu evaluarea formelor din corpul do-ului: ec1,…, ecq Dacă et este diferită de nil se evaluează în ordine formele er1,…, erp, ultima valoare fiind si cea întoarsă de do La începutul oricărei iteraŃii, cu excepŃia primei, variabilele sunt actualizate astfel: toate formele de incrementare sunt evaluate de la stânga la dreapta si rezultatele reprezintă valorile la care sunt legate variabilele în paralel În cazul formei do*, evaluarea formelor de iniŃializare urmată de legarea variabilelor la aceste valori, atât la iniŃializare cât si la fiecare ciclu al iteraŃiei, se efectuează serial: (do* ((s1 ’ei1 ’es1)… (sn ’ein ’esn)) (’et ’er1… ’erp) ’ec1… ’ecq) >>> erp | ei1,s1ei1,…,ein,snein,while(not et){ec1,…, ecq,es1,s1es1,…,esn,snesn},er1,…,[erp],unbind(s1,…, sn) Exemplele următoare exploatează legările paralele ale variabilelor de index: (defun list-reverse(lst) (do ((x lst (cdr x)) (y '() (cons (car x) y))) ((endp x) y))) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 58 FuncŃia list-reverse9, realizează inversarea unei liste Variabila de ciclu x se leagă la liste din ce în ce mai scurte din cea iniŃială, lst, în timp ce variabila y pleacă de la lista vidă si adaugă la fiecare iteraŃie primul element al listei x Când x ajunge la lista vidă do se termină întorcând valoarea acumulată în y (defun rev (lst) (cond ((null lst) nil) ((null (cdr lst)) lst) (t (do ((z (cddr lst) (cdr z)) (y (cdr lst) z) (x (progn() (rplacd lst nil) lst) y)) ((null z) (rplacd y x) y) (rplacd y x))))) FuncŃia rev definită aici realizează, de asemenea, inversa unei liste, dar, spre deosebire de exemplul precedent, nu se consumă alte celule de memorie faŃă de cele în care era memorată lista dată în intrare Cu alte cuvinte, lista se inversează “în ea însăsi” Primele două clauze cond tratează lista vidă si lista formată dintr-un singur element Orice listă care are minimum două elemente este preluată de do Variabilele x, y si z Ńin minte la fiecare ciclu trei celule cons aflate în secvenŃă în lista iniŃială La iniŃializare, cdr-ul celulei de pe prima poziŃie (indicată de x) este făcut nil pentru a realiza sfârsitul de listă OperaŃia efectivă a fiecărui pas, realizată pe ultimul rând al definiŃiei de funcŃie, constă în modificarea părŃii cdr a elementului din mijloc (y) pentru a indica elementul precedent (x) După realizarea operaŃiei din ciclu, variabilele îsi transferă una alteia valorile în paralel mutându-se toate cu câte un element mai spre sfârsitul listei iniŃiale Când ultima variabilă (z) devine nil înseamnă că y indică ultimul element al vechii liste, ca urmare însăsi cdr-ul acesteia este modificat la elementul precedent si se întoarce valoarea indicată de ea, care reprezintă acum capătul listei inversate 2 5 8 Valori multiple si exploatarea lor După cum s-a putut vedea, o seamă de funcŃii, printre care floor si ceiling, întorc valori multiple O generare explicită de valori multiple se poate face cu formele values-list si values: > (values-list (list 'a 'b 3 'c)) A B 3 C > (values 'a 'b 3 'c) A B 3 C DiferenŃa dintre ele este că prima solicită o listă pe când a două primeste valorile pe care le “multiplică” ca simple argumente Cea mai simplă metodă de exploatare a valorilor multiple constă în transformarea lor în liste Forma multiple-value-list face acest lucru: 9 Exemplu preluat din (Steele, 1990) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 59 > (multiple-value-list (ceiling 7 3)) (3 -2) Se observă că values-list si multiple-value-list sunt inverse una alteie: > (multiple-value-list (values-list (list 'a 'b 3 'c))) (A B 3 C) > (values-list (multiple-value-list (ceiling 7 3))) 3 -2 Forma multiple-value-call transferă valori multiple, ca argumente, unui apel de funcŃie FuncŃionala care asamblează valorile multiple trebuie dată ca prim argument al apelului: > (multiple-value-call #'list 1 (ceiling 7 3) (values 5 6) 'alpha) (1 3 -2 5 6 ALPHA) O formă (macro) care produce legări (generează domenii) prin exploatarea valorilor multiple este multiple-value-bind Sintaxa (simplificată) este următoarea: (multiple-value-bind ({var}*) values-form {form}*) >>> {result}* în care var reprezintă un nume de variabilă, values-form este o formă care generează valori multiple, iar form reprezintă corpul în care legările sunt valorificate Ultima formă evaluată generează valoarea/valorile întoarsă/întoarse de macro > (multiple-value-bind (x y) (ceiling 7 3) (list x y)) (3 -2) 2 5 9 Închideri10 CombinaŃia dintre o funcŃie si un set de legări de variabile libere ale funcŃiei la momentul apelului acelei funcŃii se numeste închidere (closure) Închiderile sunt funcŃii împreună cu stări locale În exemplul următor, se defineste o închidere la nivelul apelului lui mapcar, pentru care n este o variabilă liberă Ea dispare la nivelul definiŃiei funcŃiei list+: > (defun list+ (lst n) (mapcar #'(lambda (x) (+ x n)) lst)) > (list+ '(1 2 3) 10) (11 12 13) 10 Exemplele din această secŃiune sînt preluate din (Graham, 1994) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 60 Următoarele funcŃii folosesc împreună o variabilă comună ce serveste de numărător Închiderea contorului într-un let în loc de a-l considera o variabilă globală îl protejează asupra referirilor accidentale > (let ((counter 0)) (defun new-id () (incf counter)) (defun reset-id () (setq counter 0))) În următorul exemplu avem o funcŃie care la fiecare apel întoarce o funcŃie împreună cu o stare locală: > (defun make-adder (n) #'(lambda (x) (+ x n))) > (setq add2 (make-adder 2) add10 (make-adder 10)) # > (funcall add2 5) 7 > (funcall add10 3) 13 FuncŃia make-adder primeste un număr si întoarce o închidere, care, atunci când e chemată, adună numărul la argument În această variantă în închiderea întoarsă de make-adder starea internă e constantă Următoarea variantă realizează o închidere a cărei stare poate fi schimbată la anumite apeluri: > (defun make-adder-b (n) #'(lambda (x &optional change) (if change (setq n x) (+ x n)))) > (setq addx (make-adder-b 1)) # > (funcall addx 3) 4 > (funcall addx 100 t) 100 > (funcall addx 3) 103 2 5 10 Transferul argumentelor în funcŃii În transferul prin valoare (Figura 2 8), înaintea evaluării funcŃiei, valorile actuale ale parametrilor se copiază ca valori ale parametrilor formali ai funcŃiei Modificări ale valorilor parametrilor formali în timpul evaluării funcŃiei nu afectează valorile parametrilor actuali: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 61 Figura 2 8: Transferul prin valoare, în general În transferul prin referinŃă (Figura 2 9) numele parametrilor formali reprezintă sinonime ale numelor parametrilor actuali Modificarea valorilor parametrilor formali în timpul evaluării funcŃiei provoacă astfel o schimbare a însăsi valorilor parametrilor actuali Această modificare reprezintă, asadar, un efect lateral al evaluării funcŃiei: Figura 2 9: Transferul prin referinŃă, în general Transferul în Lisp nu se face nici prin valoare nici prin referinŃă, dar ambele tipuri pot fi simulate În Lisp un parametru formal se leagă la valoarea comunicată prin parametrul actual Atunci când, în interiorul funcŃiei, are loc o asignare a unei noi valori variabilei formale, ea este dezlegată de la valoarea veche si legată la una nouă (Figura 2 10) Figura 2 10: Transferul prin valoare în Lisp F(x) x := v2 x: v1 în momentul apelului v2 a: v1 în timpul evaluării lui F F(a) x: în momentul apelului în timpul evaluării lui F F(x) x := v2 x:a: v1 x:a: v2 F(a) a: v1 în momentul apelului în timpul evaluării lui F (defun F(x) (setq x v2) ) x x F(a) a v1 v2 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 62 Comportamentul este, asadar, acela al unui transfer prin valoare atât timp cât în corpul funcŃiei se realizează numai deasignări ale valorilor parametrilor formali Îndată însă ce în corpul funcŃiei au lor modificări “chirurgicale” ale valorii parametrilor formali, funcŃionarea capătă trăsăturile unui transfer prin referinŃă (Figura 2 11) pentru că în acest mod parametrul actual „simte” transformările structurii accesate temporar prin parametrul formal Figura 2 11: Transferul prin referinŃă în Lisp 2 6 Macro-uri 2 6 1 DefiniŃie, macroexpandare si evaluare Un macro este în esenŃă o funcŃie care defineste o funcŃie Macro-urile sunt si mijloace prin care sintaxa Lisp-ului poate fi extinsă Evaluarea apelurilor de macro-uri este un proces în doi pasi: întâi o expresie specificată în definiŃie este construită, apoi această expresie este evaluată Primul pas – cel al construirii macro-expresiei se numeste macroexpandare O definiŃie de macro, analog unei definiŃii de funcŃie, conŃine trei elemente: un simbol care dă numele macro-ului, o listă de parametri si corpul Într-un apel de funcŃie definită de utilizator, parametrii actuali sunt evaluaŃi înainte ca parametrii formali din definiŃie să se lege la acestia Rezultă că o evaluare diferenŃiată a parametrilor nu poate fi realizată printr-o definiŃie de funcŃie Toate formele Lisp-ului în care parametrii se evaluează diferenŃiat sunt realizate intern ca macro-uri Dacă ar fi să realizăm o funcŃie care să aibă comportamentul unui if, de exemplu, utilizând însăsi forma if pentru aceasta, o definiŃie precum următoarea: > (defun my-if(test expr-da expr-nu) (if test expr-da expr-nu)) nu satisface, pentru că la intrarea în funcŃie toŃi cei trei parametri sunt evaluaŃi Astfel, într-un apel în care am dori să atribuim variabilei x valoarea DA sau NU, în funcŃie de un argument, de genul (my-if t (setq x ’da) (setq x ’nu)), cu toate că testul se evaluează la T, x ar fi întâi setat la DA si apoi la NU, el rămânând în cele din urmă cu această valoare Apelul de funcŃie întoarce însă valoarea celui de al doilea parametru: v1 în momentul apelului în timpul (defun F(x) evaluării lui F (rplaca x v2) ) x F(a) a v2 x a Cristea, IoniŃă, Pistol – InteligenŃa Artificială 63 > (my-if t (setq x ’da) (setq x ’nu)) DA > x NU Un apel de macro poate include un alt apel de macro Evaluarea unui apel al acestuia produce, mai întâi, expandarea lui, generând inclusiv un apel al macro-ului interior Urmează apoi faza de evaluare propriu-zisă a macro-ului exterior în care, la un moment dat, se lansează evaluarea macro-ului interior Ca urmare, la rândul lui, acesta mai întâi se expandează si, într-o a doua fază abia, se evaluează Procesul poate continua în acelasi mod pe oricâte niveluri de apeluri de macro-uri în macrouri, ceea ce presupune inclusiv posibilitatea de a scrie definiŃii de macro-uri recursive Macroexpandările au loc la momente diferite în diverse implementări Comportamentul descris mai sus este tipic unei implementări de genul interpretorului Acesta asteaptă momentul evaluării apelului de macro pentru a face macroexpandarea macro-ului Aceasta înseamnă că orice macro trebuie definit înaintea codului care se referă la el si că dacă un macro este redefinit, orice funcŃie care referă macro-ul trebuie de asemenea redefinită Un compilator va efectua toate macroexpandările la momentul compilării Un apel de macro ce apare în corpul definiŃiei unei funcŃii va fi expandat la momentul compilării funcŃiei, dar expresia (sau codul obiect rezultat) nu va fi evaluată până ce funcŃia nu e chemată Rezultă că un compilator nu are cum trata apeluri recursive de macro-uri, pentru că el are tendinŃa de a expanda apelul interior înainte de evaluare, ceea ce duce la un alt apel de macro, care trebuie si el expandat s a m d , făcând astfel imposibilă controlarea acestui proces > (defmacro nthb (n lst) `(if (= ,n 0) (car ,lst) (nthb (- ,n 1) (cdr ,lst)))) NTHB > (nthb 2 '(a b c d e)) C > (defmacro fact(n) `(if (zerop ,n) 1 (* ,n (fact (- ,n 1))))) FACT > (fact 4) 24 Este important să facem distincŃia dintre aceste două momente, respectiv obiectele asupra cărora operează ele, în evaluarea unui macro: pasul macroexpandării operează cu expresii, cel al evaluării – cu valorile lor 2 6 2 Despre apostroful-stânga (backquote) Un apostrof-stânga (`) construieste o formă Lisp conform modelului (template) care urmează după el Sintactic, el prefixează o listă La evaluare orice formă a listei va fi copiată, cu excepŃia: - formelor prefixate de virgulă (,), care sunt evaluate; - unei liste prefixată de o secvenŃă virgulă-at (,@), care provoacă inserarea elementelor listei Cristea, IoniŃă, Pistol – InteligenŃa Artificială 64 > (setq b 'beta d 'gamma) GAMMA > `(a ,b c ,d) (A BETA C GAMMA) > (setq x ‘(a b c)) (A B C) >`(x 1 ,x 2 ,@x) (X 1 (A B C) 2 A B C) > `(a (x 1) (,x 2)) (A (X 1) ((A B C) 2)) Apostroful-stânga însusi poate fi copiat într-o expresie prefixată cu apostrofstânga: > (setq x '(a b c)) (A B C) > `(a `b ,x) (A `B (A B C)) Putem acum relua definiŃia unui macro cu comportamentul lui if: > (defmacro my-if(test expr-da expr-nu) `(if ,test ,expr-da ,expr-nu)) MY-IF > (my-if t (setq x 'da) (setq x 'nu)) DA > x DA RestricŃii privind folosirea virgulei si a virgulei-at: • virgula poate să apară numai în interiorul unei expresii prefixate cu apostrof-stânga: > `(a ,(cons ,x '(alpha beta)) ,x) Error: Comma not inside a backquote [file position = 12] • pentru ca elementele unei liste să fie expandate prin virgulă-at, locul acesteia trebuie să fie într-o secvenŃă E o eroare a se scrie la prompter: ,@x • obiectul de inserat trebuie să fie o listă, cu excepŃia cazului în care apare ca ultim element într-o listă Astfel expresia `(a ,@1) se va evalua la (a 1), dar `(a ,@1 b) va genera un mesaj de eroare Virgule-at se folosesc cu predilecŃie în definiŃiile macro-urilor cu un număr nedefinit de argumente 2 6 3 Asupra manierei de construcŃie a macro-urilor11 Se începe prin a scrie un apel al macrou-lui ce se doreste a fi definit, urmat de expresia în care se doreste ca acesta să fie expandat Din apelul de macro se construieste lista de parametri alegând câte un nume pentru fiecare argument Între 11 Exemplele din această secŃiune si următoarele sunt reproduse din (Graham, 1994) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 65 rândul apelului si cel al expandării se trasează săgeŃi între argumentele corespunzătoare (Figura 2 12) Figura 2 12: Reguli de dezvoltare a macro-urilor Cazul unui macro cu un număr oarecare de argumente vom începe, la fel, prin a scrie un esantion de apel de macro Plecând de la acesta, construim lista de parametri ai macrou-lui, dar în care, în afară de parametrul care realizează testul, vom descrie corpul macro-ului printr-un parametru &rest sau &body Să presupunem că vrem să scriem un while care primeste un test si un corp format dintr-un număr oarecare de expresii Evaluarea lui va însemna buclarea expresiilor corpului atât timp cât expresia din test întoarce o valoare diferită de nil Apel: Scriem apoi expansiunea dorită sub apel si unim prin linii argumentele din corpul de apel cu poziŃia lor din expansiune, dar unde secvenŃa din expansiune ce va corespunde unicului parametru din apel este grupată, ca aici: (my-while (not running-engine) (look-at-engine) (or (ask-advice) (think)) (try-to-fix-the-motor) (turn-on-the-key)) (defmacro while (test &rest body) (do () ((not(not running-engine))) (look-at-engine) (or (ask-advice) (think)) (try-to-fix-the-motor) (turn-on-the-key)) (memq x choices) (member x choices :test #’eq) (defmacro memq (obj lst) `(member ,obj ,lst :test #’eq)) apelul expandarea definiŃia Cristea, IoniŃă, Pistol – InteligenŃa Artificială 66 În corpul definiŃiei, apoi, parametrul &rest (sau &body) va fi prefixat cu virgula-at: (defmacro my-while (test &body body) `(do () ((not ,test)) ,@body)) 2 6 4 Cum se testează macro-expandările? FuncŃia macroexpand-1 arată primul nivel al expandării FuncŃia macroexpand arată toate nivelurile unei expandări >(do ((w 3) (x 1 (1+ x)) (y 2 (1+ y)) (z)) ((> x 10) (princ z) y) (princ x) (princ y)) > (macroexpand-1 '(do ((w 3) (x 1 (1+ x)) (y 2 (1+ y)) (z)) ((> x 10) (princ z) y) (princ x) (princ y))) (BLOCK NIL (LET ((W 3) (X 1) (Y 2) (Z)) (TAGBODY #:$CFNH (WHEN # #) (PRINC X) (PRINC Y) (PSETQ X # Y #) (GO #:$CFNH) #:$CFNI) (PRINC Z) Y)) T 2 6 5 Asupra destructurizării Forma destructuring-bind primeste un sablon, un argument ce se evaluează la o listă si un corp de expresii si evaluează expresiile cu parametrii din sablon legaŃi la elementele corespunzătoare din listă: > (destructuring-bind (x (y) z) '(a (b) c d) (list x y z)) (A B (C D)) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 67 Destructurizarea e posibilă, de asemenea, în listele parametrilor macro-urilor Într-o definiŃie de macro, defmacro, se permite ca listele de parametri să fie structuri de liste arbitrare Când un macro de acest fel e expandat, componentele apelului vor fi asignate parametrilor ca printr-un destructuring-bind: > (defmacro our-dolist ((var list &optional result) &body body) `(progn (mapc #'(lambda (,var) ,@body) ,list) (let ((,var nil)) ,result))) OUR-DOLIST > (our-dolist (x '(a b c)) (print x)) A B C NIL > (our-dolist (x '(a b c) 'bravo) (print x)) A B C BRAVO 2 6 6 Când să folosim macro-uri? Există bucăŃi de cod care pot fi scrise atât ca macro-uri cât si ca funcŃii De exemplu: (defun 1+ (x) (+ 1 x)) (defmacro 1+ (x) `(+ 1 ,x)) Un while însă nu poate fi scris decât ca un macro: (defmacro while (test &body body) `(do () ((not ,test)) ,@body)) pentru că el integrează expresiile pe care le primeste ca body în corpul unui do unde ele vor fi evaluate numai dacă test întoarce true Printr-un macro se pot controla evaluările argumentelor din apel Orice operator care trebuie să acceseze parametrii înainte ca acestia să fie evaluaŃi trebuie scris ca macro 2 6 7 Argumente pro si contra utilizării macro-urilor Evaluarea la momentul compilării: (defun avg (&rest args) (/ (apply #’+ args) (length args))) (defmacro avg (&rest args) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 68 `(/ (+ ,@args) ,(length args))) În prima definiŃie (length args) este evaluată la momentul rulării pe când în cea de a doua – la momentul compilării: > (macroexpand-1 '(avg 1 3 4 6)) (/ (+ 1 3 4 6) 4) T 2 7 Un exemplu de program care se modifică în timpul rulării Mai jos, simbolului animal îi este atribuită o expresie care, dacă este lansată în evaluare, iniŃiază un dialog ce duce la recunoasterea unui animal Atunci când recunoasterea este eronată, programul cere interlocutorului informaŃii pentru rafinarea dialogului SecvenŃa nouă de dialog astfel generată este inserată în program, astfel încât, la o evaluare ulterioară, arborele de decizie al programului este mai bogat În acest fel, prin rulări repetate, cunoasterea programului asupra diferitelor animale se perfecŃionează (setq animal '(let ((int)(aniF)) (print "Animalul are sange cald? ") (setq ras (if (read) (print "caine") (print "lacusta"))) (print "ok? ") (if (not (read)) (progn (my-print (list "Puneti o intrebare la care " ras " sa fie raspunsul pozitiv: ")) (setq int (read-line)) (print "Animalul pentru NIL: ") (setq aniF (string (read))) (modify animal (list 'print ras) (list 'progn (list 'print int) (list 'if (list 'read) (list 'print ras) (list 'print aniF))) ) )) )) (defun modify(str old new) (cond ((or (atom str) (null str)) nil) ((equal (car str) old) (rplaca str new) T) ((modify (car str) old new) t) (t (modify (cdr str) old new)))) (defun my-print (l) (cond ((null l) (terpri)) (t (princ (car l)) (my-print (cdr l))))) Ceea ce urmează este un dialog în care utilizatorul are în minte animalul sopârlă: > (eval animal) "Animalul are sange cald? "nil "lacusta" "ok? "nil Cristea, IoniŃă, Pistol – InteligenŃa Artificială 69 Puneti o intrebare la care lacusta sa fie raspunsul pozitiv: Animalul zboara? "Animalul pentru NIL: "soparla T > (eval animal) "Animalul are sange cald? "nil "Animalul zboara?"nil "SOPARLA" "ok? "t NIL CerinŃe pentru studenŃi  Să fie capabili să implementeze algoritmi în LISP prin funcŃii si macro-uri  Să poată citi o expresie LISP Probleme P2 1 a) Să se scrie o funcŃie LISP care să creeze structura din Figura 2 13a b) Să se scrie o funcŃie care modifică această structură în cea din Figura 2 13b c) Ce va întoarce (eq (car (cdr (caddr X))) (car (cdddr X)))? Figura 2 13: a Structura iniŃială b Structura transformată P2 2 a) Să se construiască structură de celule cons din Figura 2 14a b) Să se modifice apoi la forma din Figura 2 14b c) La ce se evaluează (eq (car x) (cadr x)) - în primul caz; - si în cel de al doilea caz X Y Z Y W Zx a X Y b Cristea, IoniŃă, Pistol – InteligenŃa Artificială 70 Figura 2 14: a Structura iniŃială b Structura transformată P2 3 Să se explice ce întoarce următorul program Lisp: (defun boo(foo) (cond ((null foo) 0) (t (+ 1 (boo (cdr foo)))))) (boo ‘(alpha beta gamma)) P2 4 Să se transforme următoarea funcŃie recursivă într-una iterativă: (defun boo-iter(foo) (let ((temp 0)) (while foo (setq temp (+ 1 temp) foo (cdr foo))))) P2 5 Fie X o mulŃime de elemente ordonate crescător, X=(x1, x2 … xn), reprezentând puncte pe o axă, si fie f(x) o funcŃie ScrieŃi diverse variante de funcŃii LISP care să calculeze mulŃimea Y=(f(x1), f(x2) f(xn)) Bibliografie Church, A , 1941 The Calculi of Lambda-Conversion, Princeton University Press, Princeton, N J Giumale, Cr , PreoŃescu, D , SerbănaŃi, L D 1987 LISP, vol 1, Editura Tehnică, Bucuresti Graham, P , 1994 On Lisp Advanced Techniques for Common Lisp Prentice Hall, Englewood Cliffs, New Jersey McCarthy, J 1960 Recursive Functions of Symbolic Expressions and Their Computation by Machine, în „Communications of the ACM” (poate fi accesată la http://wwwformal stanford edu/jmc/recursive pdf) beta x a beta x b Cristea, IoniŃă, Pistol – InteligenŃa Artificială 71 Steele, G L , 1990 Common Lisp the Language, 2nd edition, Digital Press (versiune on-line la http://www cs cmu edu/Groups/AI/html/cltl/cltl2 html) Trăusan-Matu, S 2004 Programare în LISP InteligenŃă Artificială si web semantic Editura Polirom, Iasi, 2004 Tufis D 1987 TC-LISP-FuncŃiile primitive ale interpretorului Manual de programare, ITCI, 98 p Tufis, D , Cristea, D , Tecuci, D 1987 LISP, vol 2, Editura Tehnică, Bucuresti Tufis D , O Popescu 1987 TC-LISP-Biblioteca de funcŃii Manual de programare, ITCI, 101 p Situri unde găsiŃi documentaŃie, cursuri si produse: http://www franz com/ – situl companiei Franz Inc care produce si comercializează Allegro Common Lisp În secŃiunea Free Downloads puteŃi găsi ultimele versiuni de Common Lisp (CL 8 0 în februarie 2007) Allegro CL Certification Program la http://www franz com/services/classes/ oferă gratis cursuri online în vederea obŃinerii certificatelor de dezvoltator CL Cristea, IoniŃă, Pistol – InteligenŃa Artificială 72 Capitolul 3 Căutare Rezolvarea problemelor Sisteme de producŃie Diametrul interior al unei Ńevi nu trebuie să-l depăsească pe cel exterior, altfel gaura va fi pe dinafară Michael Stillwell 3 1 Formalizarea problemelor de IA În acest capitol vom vedea cum pot fi formalizate, în vederea rezolvării, problemele specifice domeniului IA În multe privinŃe formalizarea unei probleme de IA este diferită de cea a unei probleme de altă natură Desi reguli generale sunt dificil de formulat, pentru că varietatea acestor probleme este extrem de mare, vom enunŃa câteva precepte care pot ghida acest proces 3 1 1 Problemă, instanŃă de problemă, spaŃiul stărilor De foarte multe ori, când vorbim de o soluŃie în domeniul IA ne interesează pasii în rezolvarea unei probleme, mai mult decât niste date care să fie obŃinute în iesire ca rezultat al unor procese de calcul aplicate unor date prezentate în intrare Să luăm ca exemplu jocul de sah O poziŃie de pe tablă reprezintă complet starea jocului într-un anumit moment EvoluŃia jocului poate fi privită ca o secvenŃă de tranziŃii dintr-o stare în alta, plecând de la o stare iniŃială si ajungând până într-o stare finală Există o stare iniŃială descrisă de o poziŃie standard, întotdeauna aceeasi în orice joc de sah Nu există o anume stare finală, dar poate fi considerată stare finală orice configuraŃie a tablei în care un rege se află într-o poziŃie atacată si nu poate iesi din acea poziŃie prin nici o mutare legală Între aceste două stări există un număr finit, dar extrem de mare, de posibilităŃi de a ajunge prin mutări legale Numărul total de poziŃii ale jocului de sah formează ceea ce se numeste spaŃiul stărilor Vom exemplifica formalizarea problemelor de IA pe câteva exemple de probleme considerate clasice în domeniu Astfel de probleme, datorită dimensiunii lor mici, sunt cunoscute sub numele de probleme jucărie (toy problems) În multe cazuri studiul lor ajută la identificarea metodologiei de rezolvare a problemelor de dimensiune reală În alte cazuri însă diferenŃa de dimensiune între problemele jucărie si cele reale este atât de mare încât soluŃiile probate pe primele nu pot fi aplicate pe cele din urmă Si într-un caz si în celălalt, studiul problemelor jucărie constituie un antrenament util pentru dezvoltarea abilităŃilor de a lucra cu concepte ale domeniului IA Cristea, IoniŃă, Pistol – InteligenŃa Artificială 73 Problema 8-puzzle: Există o tablă 3x3 pe care se găsesc si se pot muta 8 piese pătrate La un moment dat, o singură piesă poate fi miscată cu o poziŃie, pe orizontală sau verticală, în limitele cadrului tablei, în singurul loc liber Plecând de la o configuraŃie iniŃială a tablei trebuie să se ajungă într-alta, ce este de asemenea dată Problema misionarilor si canibalilor: 3 misionari si 3 canibali se află la marginea unui râu si doresc să treacă pe celălalt mal Ei au la dispoziŃie o barcă de două persoane Dacă la un moment dat, pe un mal sau pe celălalt numărul canibalilor întrece pe cel al misionarilor, misionarii sunt în pericol de a fi mâncaŃi de canibali Problema constă în a afla cum pot trece râul cele 6 persoane în deplină siguranŃă Problema generării frazelor în limbaj natural: Se dispune de un lexic (prin care fiecărui cuvânt i se atasează o parte de vorbire) si de o gramatică (care este o colecŃie de reguli, fiecare spunând cum poate fi expandat o categorie compusă în subcompusi) Se doreste generarea unei exprimări corecte gramatical Nu poate fi considerat jucător de sah un personaj capabil să rezolve doar o anume situaŃie de pe tabla se joc, ci cel capabil să abordeze orice situaŃie Analog, nu poate fi considerat conducător auto o persoană capabilă să miste masina numai de acasă până la serviciu Ca să merite acest titlul, teoretic cel puŃin, acea persoană trebuie să poată conduce masina din orice punct în orice alt punct Aceste exemple vor să pună în evidenŃă diferenŃa dintre probleme si instanŃe ale lor Jocul de sah defineste o problemă Conducerea masinii – o alta În cazul jocului de sah, de obicei se precizează o poziŃie iniŃială si o indicaŃie asupra terminării (de exemplu, care jucător trebuie să câstige, eventual si în câte mutări) În cazul conducerii masinii, se precizează unde se află masina, unde trebuie ea adusă si se cunoaste o hartă pe care sunt marcate drumurile pe care poate ea circula Astfel de descrieri definesc instanŃe de problemă În problema 8-puzzle o instanŃă este dată de o anumită pereche formată din configuraŃia iniŃială si finală a tablei În problema misionarilor si canibalilor, asa cum este ea formulată, nu există decât o unică instanŃă Dar ea suportă un enunŃ general care să admită si alte instanŃe de problemă, spre exemplu cazul a n canibali si a n misionari O instanŃă poate fi atunci problema în care apar 3 canibali + 3 misionari, alta cea în care apar 4 canibali + 4 misionari etc Prima preocupare într-o problemă de IA este de a recunoaste în problema generală instanŃele acesteia Cristea, IoniŃă, Pistol – InteligenŃa Artificială 74 În problema generării limbajului o instanŃă de problemă este dată de o gramatică Astfel, de exemplu, am putea avea gramatica G1 = {N1, T1, S1, P1}, în care: N1 = {PROP, GN, GV, S, V} – o mulŃime de simboluri neterminale cu semnificaŃiile: propoziŃie, grup nominal, grup verbal, substantiv si verb; T1 = {pisica, soarecele, prinde} – o mulŃime de cuvinte; S1 = {PROP} – un simbol de start al gramaticii, alegerea lui semnificând că ceea ce se doreste să se obŃină reprezintă propoziŃii ale acestui mini-limbaj; P1 = {PROP := GN GV, GN := S, GV := V GN, S := pisica, S := soarecele, V := prinde} – o mulŃime de reguli de producŃie, cu semnificaŃia evidentă O instanŃă de problema, în acest caz, ar cere obŃinerea unei propoziŃii oarecare în limbajul descris de această gramatică Toate instanŃele aceleiasi probleme au ceva în comun: maniera de rezolvare Acelasi algoritm ar trebui să lucreze pentru orice instanŃă a unui probleme date Având o soluŃie pentru cazul general, rezolvarea unei anumite instanŃe reprezintă doar o chestiune de alimentare a programului cu alte date de intrare Din acest punct de vedere o problemă de IA nu se deosebeste cu nimic de o problemă clasică 3 1 2 Recunoasterea stărilor O stare reprezintă a configuraŃie anumită a entităŃilor care populează universul problemei în drumul spre soluŃie Nu este însă întotdeauna elementar să se decidă care dintre momentele intermediare ale drumului spre soluŃie trebuie considerată stare si care nu Dacă am imagina un film care redă drumul spre soluŃie, întrebarea la care trebuie să răspundem este ce cadre reprezintă imagini de stări si care nu De asemenea, este foarte util să putem aprecia cât de mare este spaŃiul stărilor În cazul jocului 8-puzzle recunoastem imediat că o stare trebuie să reprezinte o configuraŃie anumită a tablei la un moment dat Ar fi greu de imaginat de ce o alegere a stării ca, de exemplu, aceea în care piesa mobilă să fie într-o poziŃie intermediară între un cadru si următorul, ar avea vreo semnificaŃie anumită în rezolvarea problemei Dimensiunea problemei este dată de numărul stărilor teoretic posibile în rezolvarea problemei La 8-puzzle numărul acestora este 9!=362 880 pentru că avem 9 posibilităŃi de a aseza o piesă pe tabla goală, pentru fiecare poziŃie a acesteia – avem 8 posibilităŃi de a o aseza pe a doua, s a m d În problema canibalilor si misionarilor o stare este o ipostază anumită în traversarea râului Filmul, prin însusi esenŃa lui de naraŃiune vizuală, abundă în detalii Oare ce cadre ale filmului care ar nara vizual traversarea care convine ca A doua preocupare într-o problemă de IA este de a recunoaste o stare si de a aprecia dimensiunea spaŃiului stărilor Cristea, IoniŃă, Pistol – InteligenŃa Artificială 75 rezolvare a problemei pot fi luate ca reprezentative pentru a descrie stări? Cea mai adecvată ipostază de stare aici este o situaŃie în care barca se află pe unul din maluri si în care avem un număr de misionari si unul de canibali pe malul cu barca în timp ce restul lor se află pe celălalt mal Nu avem nici un motiv să credem că o poziŃie intermediară, de exemplu aceea în care barca s-ar afla la mijlocul râului în cursul unei traversări, ar putea să ne intereseze Considerarea acestor cadre intermediare drept stări ar mări nejustificat spaŃiul stărilor Ca să înŃelegem de ce este inutilă considerarea unei poziŃii intermediare în traversarea râului, drept stare, să observăm că din poziŃia în care barca se află pe unul din maluri, cu un număr anumit de misionari si canibali pe fiecare mal, si până în situaŃia în care barca este pe malul opus, cu o altă combinaŃie de misionari si canibali pe ambele maluri, am putea să deducem – modulo un număr de detalii fără importanŃă – toate poziŃiile intermediare în care barca s-ar fi aflat între un mal si celălalt Considerarea drept stare a oricărei poziŃii intermediare nu aduce deci nici un spor de informaŃie faŃă de cazul în care am ignora-o Prin aceasta deducem că spaŃiul stărilor problemei misionarilor si canibalilor este dat de numărul posibil de combinaŃii c+m+b (cu c – numărul de canibali, m – numărul de misionari, b – existenŃa ori nu a bărcii) pe cele două maluri, fiecare în parte respectând restricŃia, să-i zicem de "ne-ingerare": b – ccc+mmm (invalidă: barca e pe malul pe care nu se află nici un călător) m+b – ccc+mm (invalidă: situaŃie periculoasă pe malul drept) mm+b – ccc+m (invalidă: situaŃie periculoasă pe malul drept) mmm+b – ccc c+b – cc+mmm c+m+b – cc+mm c+mm+b – cc+m (invalidă: situaŃie periculoasă pe malul drept) c+mmm+b – cc cc+b – c+mmm cc+m+b – c+mm (invalidă: situaŃie periculoasă pe malul stâng) cc+mm+b – c+m cc+mmm+b – c ccc+b – mmm ccc+m+b – mm (invalidă: situaŃie periculoasă pe malul stâng) ccc+mm+b – m (invalidă: situaŃie periculoasă pe malul stâng) ccc+mmm+b – adică 9 stări valide cu barca pe malul stâng, la care se adaugă tot atâtea cazuri în care barca se află pe malul drept, deci un total de 18 stări În problema generării frazelor, o stare poate fi o configuraŃie de simboluri terminale si neterminale, la un anumit moment dat în derivare SpaŃiul stărilor este corelat cu dimensiunea limbajului generat de gramatică, mai mare decât acesta, posibil infinită dacă gramatica este recursivă În cazul particular al gramaticii date mai sus în această secŃiune, spaŃiul total cuprinde aproximativ 37 de stări Comparând spaŃiile acestor probleme cu cel al stărilor jocului de sah, care se stie că este de ordinul a 10120 putem înŃelege de ce jocul de sah este mult mai greu de rezolvat decât oricare dintre problemele noastre jucărie Cristea, IoniŃă, Pistol – InteligenŃa Artificială 76 3 1 3 Reprezentarea stărilor În problema 8-puzzle, o stare poate fi reprezentată de o matrice 3x3 în care elementele sunt numere cuprinse între 0 (reprezentând spaŃiul) si 9 O altă posibilitate ar fi să reprezentăm tabla ca trei vectori, fiecare cu câte trei poziŃii Alegerea uneia sau a alteia dintre posibilităŃi depinde de usurinŃa cu care se descriu condiŃiile asupra tablei si acŃiunile capabile să transforme o stare în alta, după cum vom vedea mai departe Să observăm că în problema canibalilor si misionarilor este suficient să Ńinem minte situaŃia de pe un mal si poziŃia bărcii, pentru că situaŃia de pe celălalt mal se obŃine prin diferenŃă Deci o reprezentare adecvată poate fi aici un vector format din doi întregi (fiecare având valori cuprinse între 0 si 3) ce dau numărul canibalilor, respectiv al misionarilor, de pe malul stâng, si o variabilă logică care defineste existenŃa ori nu a bărcii pe malul stâng: (c, m, b) În problema generării limbajului, cum o posibilă stare este o combinaŃie de simboluri terminale si neterminale, reprezentarea unei stări poate fi un sir (listă) de simboluri Astfel, o derivare posibilă plecând de la gramatica aleasă ca exemplu este: PROP  GN GV  S GV  pisica GV  pisica V GN  pisica prinde GN  pisica prinde S  pisica prinde pisica Stările atinse în această rezolvare au fost în ordine: (PROP), (GN GV), (S GV), (pisica GV), (pisica V GN), (pisica prinde GN), (pisica prinde S), (pisica prinde pisica) 3 1 4 Reprezentarea tranziŃiilor între stări O soluŃie într-o problemă de IA înseamnă găsirea unei căi între o stare iniŃială si o stare finală Putem să ne imaginăm un proces de rezolvare în două moduri: o manieră în care stările există deja, iar rezolvarea presupune o tranzitare, de către un automat, a acestui spaŃiu al lor deja generat si o alta în care stările se creează doar în momentul atingerii lor, ele neexistând anterior În primul caz o miscare legală provoacă părăsirea unei stări si trecerea în alta, în timp ce în al doilea caz o miscare legală provoacă generarea unei noi stări plecând de la una dată Deosebirea este de natură implementaŃională si are, evident, o mare importanŃă în eficienŃa procesului de rezoluŃie însă nu influenŃează maniera generală de rezolvare a problemei Pentru efectuarea acestei "deplasări" în spaŃiul stărilor trebuie definit un set de operatori, sau reguli de producŃie, sau simplu reguli, care precizează miscările legale Se întâmplă adesea ca aceleasi tipuri de tranziŃii să poată fi aplicate între perechi de stări diferite Spre exemplu, în Figura 3 1 sunt sugerate prin săgeŃi de forme diferite patru tipuri de tranziŃii A treia preocupare într-o problemă de IA este găsirea celei mai adecvate reprezentări a stărilor A patra preocupare în descrierea unei probleme de IA este reprezentarea tranziŃiilor posibile între stări (reguli) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 77 Figura 3 1: TranziŃiile între stări pot fi clasificate după tipuri Dacă este posibilă clasificarea tranziŃiilor pe tipuri, atunci este probabil ca aceleasi tranziŃii să se aplice atunci când stările de plecare au ceva în comun, cu alte cuvinte îndeplinesc niste condiŃii similare Există mai multe modalităŃi de a preciza tranziŃiile legale dintr-o stare în alta Una este de a le descrie "cu cărŃile foarte aproape de ochi", cu alte cuvinte într-o manieră care să ia în considerare detalii legate anumite instanŃe de problemă În general obŃinem astfel un număr mare de reguli O descriere satisfăcătoare trebuie să se preocupe să fie suficient de generală pentru a o putea utiliza în cât mai multe instanŃe date de problemă De exemplu, o miscare uzuală de deschidere la un joc de sah este avansarea pionului cu două poziŃii Această miscare a pionului nu este însă permisă decât atunci când pionul se află în poziŃia lui iniŃială, în orice alt moment al jocului pionul putând avansa doar cu o poziŃie Am avea asadar o serie de reguli de forma: regula mut•-pion-din-a DAC• pion în pozi•ia (a,2) •i pozi•ia (a,3) e liber• •i pozi•ia (a,4) e liber• ATUNCI mut• pionul din pozi•ia (a,2) în pozi•ia (a,4) Vom avea un număr de 8 reguli de acest fel, câte una pentru fiecare pion O reprezentare mai economică ar utiliza o singură regulă capabilă să exprime poziŃia oricărui pion aflat pe al doilea rând care avansează pe rândul patru Cristea, IoniŃă, Pistol – InteligenŃa Artificială 78 regula mut•-pion(x) DAC• pion în pozi•ia (x,2) •i pozi•ia (x,3) e liber• •i pozi•ia (x,4) e liber• ATUNCI mut• pionul din pozi•ia (x,2) în pozi•ia (x,4) În general o regulă este de forma: DACĂ ATUNCI Activitatea pe care o poate desfăsura o regulă poate fi exprimată astfel: dacă partea de condiŃii este satisfăcută de starea curentă, atunci se realizează acŃiunile Uneori, partea de acŃiuni înseamnă generarea unei noi stări, alteori doar tranzitarea într-o stare care era anterior generată Din cele de mai sus rezultă că preocuparea a patra constă în inventarierea tuturor tranziŃiilor posibile între stări si descrierea acestor tranziŃii ca reguli formate din condiŃii si acŃiuni Un set de reguli este specific unei probleme iar nu unei instanŃe de problemă Cu alte cuvinte, acelasi set de reguli trebuie să poată fi aplicat pentru rezolvarea oricărei instanŃe a unei probleme date În 8-puzzle, reguli posibile ar putea fi: mută-1-sus, mută-1-jos, mută-1- dreapta, mută-1-stânga, mută-2-sus, s a m d , fiecare dintre ele condiŃionând, bineînŃeles, executarea miscării de existenŃa unei poziŃii în direcŃia respectivă cuprinsă în cadrul tablei Am avea astfel câte patru reguli pentru fiecare număr (plăcuŃă), adică 32 de reguli Un salt calitativ în reprezentarea regulilor îl obŃinem însă dacă în loc să ne intereseze mutarea unei piese ne-am concentra asupra mutării blancului Putem astfel să restrângem numărul de reguli la 4: mută-blancsus, mută-blanc-jos, mută-blanc-dreapta, mută-blanc-stânga Regula mut•-blanc-sus DAC• blancul nu e lipit de marginea de sus a tablei ATUNCI schimb• pozi•ia blancului cu a c•su•ei aflat• deasupra acestuia În problema generării frazelor, o regulă ar trebui să mimeze destul de aproape o regulă de producŃie a gramaticii, pentru că, între o stare si următoarea, un simbol aflat în partea stângă a unei reguli dispare, locul lui fiind luat de simbolurile aflate în partea dreaptă a regulii Ca urmare vom avea tot atâtea reguli ale sistemului de IA câte reguli de producŃie are gramatica 3 1 5 Căutarea soluŃiei Am discutat până acum despre spaŃiul stărilor unei probleme si am învăŃat să alegem o reprezentare pentru stări Stim că tranziŃiile între stări sunt descrise de un set de operatori pe care le-am numit reguli de producŃie si am văzut că a rezolva o problemă înseamnă a găsi un drum între o stare iniŃială si una sau mai multe stări finale ce sunt cunoscute precis ori numai descrise printr-un set de Cristea, IoniŃă, Pistol – InteligenŃa Artificială 79 restricŃii Maniera în care organizăm căutarea în spaŃiul stărilor, deci modul în care înlănŃuim operatorii pentru găsirea soluŃiei constituie următoarea preocupare Problemele de IA se aseamănă prin aceea că în toate rezolvarea presupune nu găsirea unei anume stări, ci găsirea unui drum care să unească o stare iniŃială de una finală Atunci când starea finală nu este precizată cu exactitate, găsirea unui drum către o stare, care este recunoscută ca fiind finală prin satisfacerea unor constrângeri specifice, coincide, totodată, cu darea unui răspuns asteptat Figura 3 2: Rezolvarea unei probleme de IA prin navigare în spaŃiul stărilor Acest lucru face ca o problemă de IA să fie una de căutare într-un spaŃiu al stărilor Din cauză că, adesea, spaŃiul stărilor este foarte mare se utilizează diferite strategii pentru a eficientiza căutarea Există mai multe tipuri de strategii, dar ele sunt clasificate în două clase mari: irevocabile si tentative Aplicarea unei strategii este necesară pentru a decide calea de urmat în situaŃiile în care dintr-o stare anumită există mai multe căi de a tranzita într-o altă stare, ca urmare mai mult decât o singură regulă este posibil de a fi aplicată stare iniŃială stare fundătură stare finală posibilă stare finală atinsă dimensiunea spaŃiului stărilor soluŃie tranziŃie Alegerea unei strategii reprezintă cea de a 5-a preocupare în rezolvarea unei probleme de IA Cristea, IoniŃă, Pistol – InteligenŃa Artificială 80 3 2 Exemple de formalizări Vom continua exemplificarea primelor patru precepte pentru rezolvarea unei probleme de IA, prezentate în secŃiunea precedentă, cu încă două probleme, de asemenea bine-cunoscute 3 2 1 MaimuŃa si banana O maimuŃă este închisă într-o cuscă în care se mai află o banană atârnată de tavan la o înălŃime la care maimuŃa nu poate ajunge si, într-un colŃ, o cutie După un număr de încercări nereusite de a apuca banana, maimuŃa merge la cutie, o deplasează sub banană, se urcă pe cutie si apucă banana Se cere să se formalizeze maniera de raŃionament a maimuŃii ca un sistem de reguli de producŃie CerinŃa I Problemă – instanŃă de problemă DistincŃia dintre problemă si instanŃă a ei este nesemnificativă în acest caz Sunt posibile slabe variaŃii ale enunŃului în care de exemplu se precizează poziŃiile iniŃiale relative ale obiectelor din cuscă etc CerinŃa a II-a Aprecierea a ce reprezintă o stare si a spaŃiului stărilor Dacă ar fi să eliminăm dintr-un film care ar derula acŃiunile maimuŃii între situaŃia în care ea se află într-un colŃ, cutia într-alt colŃ si banana e legată de tavan si situaŃia în care maimuŃa e urcată pe cutie, la verticala babanei si Ńine în mână banana, acele secvenŃe pe care nu le considerăm importante pentru a rămâne numai cu cadrele semnificative, am rămâne probabil cu următoarea secvenŃă de “benzi desenate”: Figura 3 3: O secvenŃă de stări care rezolvă problema maimuŃii si a bananei Cristea, IoniŃă, Pistol – InteligenŃa Artificială 81 În afara acestor stări, care sunt evidente si absolut necesare în derularea filmului, dacă am investiga alte posibile ipostaze ale maimuŃii în tentativa ei de a ajunge la banană, am găsi, probabil, printre altele, si pe acestea: Figura 3 4: Stări posibile dar neinteresante MulŃimea tuturor acestor stări, fie că sunt ori nu pe drumul spre soluŃie, formează mulŃimea stărilor problemei Simplitatea acestei probleme ne-ar putea determina să lăsăm la o parte acele stări care nu pot face parte dintr-o eventuală cale spre soluŃie Acesta este unul din pericolele care pot face o soluŃie inacceptabilă Nu trebuie să uităm că ceea ce facem noi este formalizarea unei probleme ce trebuie rezolvată de “cineva” care nu cunoaste soluŃia sau cel puŃin, nu o cunoaste în maniera în care o cunoastem noi Un inventar atent al tuturor situaŃiilor în care ar putea să ajungă un automat ce se miscă în spaŃiul dat trebuie întotdeauna făcut Să nu amestecăm cunoasterea noastră, ca fiinŃe raŃionale, cu cea a masinii care nu “stie” nimic în momentul în care începe să “descopere” soluŃia CerinŃa a III-a Reprezentarea stărilor În reprezentarea stărilor va trebui să ne gândim care sunt aspectele care contează în scenele pe care le-am decelat ca semnificative pentru a reprezenta stări Uneori ceea ce contează sunt relaŃiile dintre obiectele ori personajele conŃinute în scene Este ceea ce se întâmplă în problema noastră: aici ne interesează relaŃiile reciproce care există între maimuŃă, cutie si banană Astfel  maimuŃa faŃă de cutie se poate afla: “la distanŃă”, “lângă”, “pe” sau “sub”;  cutia faŃă de banană se poate afla: “lateral” sau “sub”;  maimuŃă faŃă de banană se poate afla: “la distanŃă” (adică la o distanŃă de unde nu o poate apuca), “aproape” (adică la o distanŃă de unde o poate apuca) sau “Ńinând-o” Desigur că dacă avem codificare aceste relaŃii, cele simetrice lor (respectiv dintre cutie si maimuŃă, banană si cutie si banană si maimuŃă), pot fi inferate imediat si deci nu mai trebuie codificate Cristea, IoniŃă, Pistol – InteligenŃa Artificială 82 Următoarele predicate devin astfel cele de care avem nevoie RelaŃia MaimuŃă – Cutie: MC-departe = MaimuŃa se află departe de Cutie MC-lângă = MaimuŃa se află lângă Cutie MC-pe = MaimuŃa se afla pe Cutie MC-sub = MaimuŃa de află sub Cutie RelaŃia Cutie – Banană: CB-lateral = Cutia este asezată lateral faŃă de Banană CB-sub = Cutia este asezată sub Banană RelaŃia MaimuŃa – Banană: MB-departe = MaimuŃa se află departe de Banană MB-aproape = MaimuŃa se află aproape de Banană MB-Ńine = MaimuŃa Ńine Banana Cu aceste predicate, descrierea stărilor problemei devine: Starea iniŃială: MC-departe, CB-lateral, MB-departe Starea finală: MC-pe, CB-sub, MB-Ńine CerinŃa a IV-a Reprezentarea regulilor Regulile reprezintă descrierea tranziŃiilor între stări Când proiectăm regulile, ca si în cazul reprezentării stărilor, ne punem problema să descriem toate tranziŃiile posibile, chiar si cele care nouă, cu mintea noastră de fiinŃe umane, ni se par absurde, ca de exemplu, urcarea maimuŃei pe cutie într-un punct ce nu se află pe verticala bananei, împingerea ei până într-un punct ce nu se află pe verticala bananei, urcarea cutiei deasupra capului ori coborârea maimuŃei de pe cutia aflată la verticala bananei fără banană Trebuie să ne plasăm în postura masinii care nu stie soluŃia, ci trebuie s-o găsească singură Ca urmare trebuie să-i îngăduim toate miscările posibile în acest univers pe care l-am descris, urmând ca ea singură să evite acele miscări ce sunt absurde sau inutile Următoarele tranziŃii pot fi inventariate: • aflată departe de cutie, maimuŃa de aproprie de cutie: apropie-MC; • aflată lângă cutie, maimuŃa se depărtează de cutie: depărtează-MC; • aflată lângă cutie, maimuŃă trage cutia sub banană: trage-sub-MCB; • aflată lângă cutie si sub banană, maimuŃă trage cutia de sub banană: tragelateral- MCB; • aflată lângă cutie, maimuŃă se urcă pe ea: urcă-MC; • aflată pe cutie, maimuŃa coboară de pe ea: coboară-MC; • aflată pe cutie, maimuŃa se ridică pentru a se apropia de banană: apropie-MCB; Cristea, IoniŃă, Pistol – InteligenŃa Artificială 83 • aflată pe cutie si ridicată pentru a apuca banana, maimuŃa se ghemuieste, depărtându-se de banană: depărtează-MCB; • aflată lângă cutie, maimuŃa îsi urcă cutia deasupra capului: urcă-pe-cap-MC; • din postura în care maimuŃă Ńine cutia deasupra capului, maimuŃa îsi dă jos cutia de pe cap: coboară-de-pe-cap-MC; • aflată aproape de banană, maimuŃa apucă banana: apucă-MB Vom conveni să exprimăm regulile prin forma generală: Figura 3 5: O regulă În partea de condiŃii caracterizăm minimum de cunostinŃe necesare pentru a descrie starea în care dorim să se aplice regula Trebuie să ne imaginăm o regulă ca si când n-ar fi aplicată de noi ci s-ar aplica singură atunci când găseste condiŃii favorabile, adică când starea curentă a sistemului satisface condiŃiile ei Partea de condiŃii nu conŃine nicidecum o descriere exhaustivă a stării, ci numai a unei părŃi a ei, ceea ce este semnificativ pentru depistarea stării De exemplu, dacă dorim ca o regulă să se aplice numai când maimuŃa se află lângă cutie, în partea de condiŃii a regulii vom include numai predicatul MC-lângă, desi starea respectivă, de exemplu starea a doua din secvenŃa de mai sus, mai are în descrierea ei si predicatele MBdeparte si CB-lateral Odată găsită starea în care se verifică condiŃiile regulii, regula se aplică, ceea ce are ca rezultat efectuarea anumitor schimbări în stare Schimbările din stare sunt descrise în partea ei de acŃiuni Din nou, partea de acŃiuni a regulii nu descrie în întregime starea de sosire ci numai schimbările care se produc în stare pentru a o face diferită de starea de plecare Să mai observăm că starea de plecare din Figura 5 nu trebuie confundată cu starea iniŃială din formularea problemei, după cum starea de sosire e altceva decât starea finală Orice pereche de două stări, între care poate avea loc o tranziŃie, cuprinde o stare de plecare, respectiv una de sosire dacă atunci starea de plecare starea de sosire Cristea, IoniŃă, Pistol – InteligenŃa Artificială 84 A B C C A B a starea iniŃială b starea finală Iată exprimările câtorva reguli: apropie-MC: dacă {MC-departe} atunci STERGE{MC-departe}, ADAUGĂ{MC-lângă} depărtează-MC: dacă {MC-lângă} atunci STERGE{MC-lângă}, ADAUGĂ{MC-departe} trage-sub-MCB: dacă {MC-lângă, CB-lateral} atunci STERGE {CB-lateral}, ADAUGĂ{CB-sub} trage-lateral-MCB: dacă {MC-lângă, CB-sub} atunci STERGE {CB-sub}, ADAUGĂ{CBlateral} urcă-MC: dacă {MC-lângă} atunci STERGE {MC-lângă}, ADAUGĂ{MC-pe} coboară-MC: dacă {MC-pe} atunci STERGE {MC-pe}, ADAUGĂ{MC-lângă} apropie-MCB: dacă {MC-pe, MB-distanŃă, CB-sub} atunci STERGE {MB-distanŃă}, ADAUGĂ{MB-aproape} urcă-pe-cap-MC: dacă {MC-lângă} atunci STERGE {MC-lângă}, ADAUGĂ{MC-sub} apucă-MB: dacă {MB-aproape} atunci STERGE {MB-aproape}, ADAUGĂ{MB-Ńine} 3 2 2 Lumea cuburilor (blocurilor) Se consideră o stivă de cuburi, ca cea din Figura 6a Un braŃ de robot poate efectua următoarele miscări: prinde un cub aflat deasupra unei stive sau deplasează un cub aflat în mână pentru a-l aseza fie pe masă, fie pe un alt cub care e liber deasupra Se cere să se formalizeze problema controlului braŃului pentru a aduce blocurile dintr-o configuraŃie iniŃială într-alta considerată finală, de exemplu cea din Figura 6b Nu este importantă distanŃa dintre stive, ci doar ordinea blocurilor în stive Ca să Ńinem lucrurile simple, vom considera că pentru controlul braŃului, din situaŃia în care acesta se află într-o anumită poziŃie, este suficient să se indice poziŃia următoare a lui fără a ne preocupa de traiectorie, distanŃe, accelerări ori decelerări – adică amănunte ce apar în mod normal în probleme de control a roboŃilor Figura 3 6: Problema cuburilor Cristea, IoniŃă, Pistol – InteligenŃa Artificială 85 CerinŃa I Problemă – instanŃă de problemă Dintre toate problemele posibile de mutare a unui număr oarecare de cuburi dintr-o configuraŃie iniŃială într-una finală, problema, asa cum a fost ea definită mai sus, prezintă instanŃa caracterizată prin exact trei cuburi, o anumită configuraŃie a lor ce reprezintă starea iniŃială si o anumită configuraŃie ce defineste starea finală (precizate în Figura 3 6) Este evident că în cadrul aceleiasi probleme o mulŃime de alte instanŃe de probleme pot fi definite Conturarea soluŃiilor pentru toate acestea ar trebui însă să nu necesite eforturi suplimentare de programare celor necesare rezolvării instanŃei de faŃă, de exemplu CerinŃa a II-a Aprecierea a ce reprezintă o stare si a spaŃiului stărilor Reflectând la ce anume trebuie să fie o stare în problema de faŃă, vom ajunge inevitabil la dilema: situaŃiile în care braŃul Ńine un bloc trebuiesc considerate ca stări ori nu A le ignora înseamnă a lăsa în inventarul stărilor numai poze ale stivelor, ignorând situaŃiile intermediare în care braŃul Ńine un bloc Să încercăm să analizăm cele două posibilităŃi Există două situaŃii care sunt semnificative înainte de ridicarea unui bloc: blocul se află pe masă sau blocul se află pe alt bloc Aceleasi două situaŃii sunt semnificative după lăsarea unui bloc Teoretic avem deci 2*2=4 combinaŃii posibile de miscări: de pe masă pe masă, de pe masă pe un bloc, de pe un bloc pe masă si de pe un bloc pe un alt bloc Asadar dacă ignorăm posturile intermediare ale braŃului Ńinând blocul ce se transportă, această alegere a stărilor ne va duce la scrierea a patru reguli Dacă dimpotrivă luăm în considerare ca stări si situaŃiile în care blocul de transportat este Ńinut în mâna robotului, vom avea miscările: de pe masă în braŃ, de pe bloc în braŃ, din braŃ pe masă si din braŃ pe alt bloc, adică tot patru reguli Rezultă că în acest caz, din punctul de vedere al numărului de reguli ce vor trebui elaborate, nu e importantă alegerea pe care o facem Într-un caz general însă, în care numărul stărilor de plecare si respectiv de destinaŃie (v Figura 5 pentru o reamintire a termenilor) ale miscărilor ar fi m si n, am avea un număr de m*n reguli când ignorăm posturile intermediare, dar numai m+n când nu le ignorăm Este deci mai economic, în număr de reguli ce trebuie proiectate, să încercăm să facem o spargere mai fină a miscărilor în componente prin considerarea unor stări intermediare, atunci când aceste componente se dovedesc a fi părŃi constitutive ale mai multor miscări complexe O astfel de rafinare nu-si are însă rostul atunci când stările intermediare, astfel puse în evidenŃă, nu se regăsesc în mai multe miscări pentru că în loc de a micsora numărul total de reguli lam mări inutil Doar din considerentul de a adopta soluŃia care duce în general la o reprezentare mai compactă, în rezolvarea dată mai jos opŃiunea va fi de a considera ca stări intermediare si situaŃiile în care blocuri se află în mâna robotului Invităm cititorul să construiască o soluŃie în care aceste stări intermediare sunt ascunse Cristea, IoniŃă, Pistol – InteligenŃa Artificială 86 CerinŃa a III-a Reprezentarea stărilor Să privim starea iniŃială (v Figura 3 6a) si să încercăm să decidem care sunt elementele esenŃiale în reprezentarea ei Asa cum am convenit deja, ceea ce interesează într-o stare este ordinea blocurilor în stive (la un moment dat ar putea să apară mai multe) cât si starea braŃului, adică dacă e liber sau dacă dimpotrivă Ńine un cub Avem mai multe posibilităŃi de a defini ordinea blocurilor într-o stivă: • utilizând un vector de nume de blocuri si o convenŃie asupra capătului stivei: (A, B, C) – cu semnificaŃia, de exemplu, că blocul de pe masă este A, iar cel liber deasupra este C Reprezentarea aceasta (v Figura 3 7a) este economică si are avantajul că poate fi usor modificată pentru a descrie situaŃia în care există mai mult decât o singură stivă Fiecare stivă poate fi definită printr-un predicat stiva Starea iniŃială devine {stiva(A, B, C)}, iar cea finală {stiva(C, B), stiva(A)}; • precizând prin niste predicate, să zicem peste si sub, vecinii pe care fiecare bloc îi are dedesubt si respectiv deasupra Cu această convenŃie, starea iniŃială ar fi reprezentată prin setul de predicate: {peste(A, masă), sub(A, B), peste(B, A), sub(B, C), peste(C, B), sub(C, nil)}, unde masă si nil ar semnifica masa si respectiv lipsa unui bloc (v Figura 3 7b) Această soluŃie are dezavantajul unei anumite redundanŃe în reprezentare Într-adevăr faptul că blocul B se află peste blocul A este precizat atât de predicatul sub(A, B) cât si de peste(B, A); • redundanŃa din notaŃia de mai sus sugerează notarea numai a relaŃiilor dintre blocurile vecine si dintre acestea si masă, precum si a blocurilor care sunt libere deasupra Cu predicatele peste si liber, starea iniŃială poate fi notată: {peste(A, masă), peste(B, A), peste(C, B), liber(C)}, iar cea finală: {peste(C, masă), peste(B, C), liber(B), peste(A, masă), liber(A)} (v Figura 7c) Figura 3 7: PosibilităŃi de reprezentare a asezării relative a blocurilor b ordine definită prin vecinătăŃi locale A peste su b B peste su b C peste su b nil mas ă c ordine definită prin relaŃii dintre obiecte A peste B peste peste masă C liber a ordine definită global A B C stiva Cristea, IoniŃă, Pistol – InteligenŃa Artificială 87 În toate aceste cazuri mai trebuie adăugată cunoasterea asupra braŃului Două sunt stările care caracterizează braŃul: braŃul este gol si braŃul Ńine blocul X (v Figura 3 8), adică predicatele: mâna-liberă si respectiv mâna-Ńine(X) Figura 3 8: Reprezentarea configuraŃiilor mâinii Vom continua să investigăm în paralel prima si ultima variantă Astfel pentru prima variantă vom avea: Starea iniŃială: {stiva(A, B, C), mâna-liberă} Starea finală: {stiva(C, B), stiva(A), mâna-liberă} iar pentru ultima variantă: Starea iniŃială: {peste(A, masă), peste(B, A), peste(C, B), liber(C), mâna-liberă} Starea finală: {peste(C, masă), peste(B, C), liber(B), peste(A, masă), liber(A), mâna-liberă} CerinŃa a IV-a Reprezentarea regulilor Cele patru tipuri de miscări descoperite mai sus, în convenŃia în care reprezentăm ca stări si situaŃiile în care blocurile sunt Ńinute în mâna robotului, duc în mod direct la scrierea a patru reguli, în forma pe care am convenit-o deja în secŃiunea 3 1 4, adică: dacă atunci , unde în partea dacă vom descrie condiŃii pentru recunoasterea stărilor de plecare ale regulii, iar în partea atunci, vom descrie acŃiuni Aceste acŃiuni trebuie să specifice modificările de realizat în starea de plecare pentru ca ea să se transforme în starea de sosire Ele vor consta din eliminarea unor predicate din descrierea stării de plecare si includerea altora, deci vor avea forma sterge adaugă În varianta din Figura 3 7a avem următoarele reprezentări pentru reguli (v si Figura 3 9): ia-de-pe-bloc(X,Y): dacă {stiva(*, Y, X), mâna-liberă} atunci STERGE{stiva(*, Y, X), mâna-liberă} ADAUGĂ{stiva(*, Y), mâna-Ńine(X)} unde stiva(*, X, Y) semnifică o stivă a cărei parte de la bază este oarecare X a mâna-liberă b mâna-Ńine(X) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 88 * Y X X * Y ia-de-pe-bloc(X,Y) pune-pe-bloc(X,Y) ia-de-pe-masă(X): dacă {stiva(X), mâna-liberă} atunci STERGE{stiva(X), mânaliberă} ADAUGĂ{mâna-Ńine(X)} pune-pe-bloc(X,Y): dacă {mâna-Ńine(X), stiva(*, Y)} atunci STERGE{mâna-Ńine(X), stiva(*, Y)} ADAUGĂ{stiva(*, Y, X), mâna-liberă} pune-pe-masă(X): dacă {mâna-Ńine(X)} atunci STERGE{mâna-Ńine(X)} ADAUGĂ{stiva(X), mâna-liberă} iar pentru varianta de reprezentare din Figura 7c, următoarele reguli: ia-de-pe-bloc(X,Y): dacă {peste(X, Y), liber(X), mâna-liberă} atunci STERGE{peste(X, Y), liber(X), mâna-liberă} ADAUGĂ{liber(Y), mâna-Ńine(X)} ia-de-pe-masă(X): dacă {peste(X, masă), liber(X), mâna-liberă} atunci STERGE{peste(X, masă), liber(X), mâna-liberă} ADAUGĂ{mâna-Ńine(X)} pune-pe-bloc(X,Y): dacă {mâna-Ńine(X), liber(Y)} atunci STERGE{mâna-Ńine(X), liber(Y)} ADAUGĂ{peste(X, Y), liber(X), mâna-liberă} pune-pe-masă(X): dacă {mâna-Ńine(X)} atunci STERGE{mâna-Ńine(X)} ADAUGĂ{peste(X, masă), liber(X), mâna-liberă} Figura 3 9: Regulile X X ia-de-pe-masă(X) pune-pe-masă(X) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 89 3 3 Controlul sistemelor de producŃie 3 3 1 Strategii irevocabile O strategie irevocabilă este una în care orice miscare în spaŃiul stărilor este ireversibilă Cale de întoarcere nu există O strategie irevocabilă aparent merge la sigur Dar imposibilitatea de a mai continua la un moment dat duce, inevitabil, la oprirea căutării si deci esec Este ca si cum as cunoaste deja soluŃia si atunci mă îndrept direct spre ea Dar ce sens mai are căutarea dacă cunosc deja soluŃia? DistincŃia provine din gradul de cunoastere a soluŃiei problemei: cunoastere globală (imaginaŃi-vă găsirea drumului într-un labirint privit dintr-un balon) faŃă de cunoastere locală (labirintul privit de un om aflat în el) Un sistem de IA care lucrează cu o strategie irevocabilă are o cunoastere locală a problemei, al aplicând o manieră generală de comportament în toate situaŃiile similare • Metoda ascensiunii (hill climbing) Numele metodei este dat de analogia cu maniera de căŃărare pe un deal a unui orb El nu e capabil să vadă vârful dealului unde trebuie să ajungă dar poate găsi în orice moment, încercând la fiecare pas în jurul lui cu bastonul, direcŃia care-l face să urce (Figura 3 10) Metoda ascensională caută să atingă starea caracterizată de valoarea maximă a funcŃiei euristice Ea nu garantează găsirea unei soluŃii din cauză că anumite probleme pot avea maxime locale sau platouri, după cum se sugerează în Figura 3 11 Figura 3 10: Metoda Hill-climbing Figura 3 11: Maximele locale, iar uneori si platourile, opresc înaintarea spre soluŃie Cristea, IoniŃă, Pistol – InteligenŃa Artificială 90 procedure hill-climbing(initial-state) begin current-state ,stack); recGetPathDepthFirstSearch(stack); end DiferenŃele acestei variante de căutare întâi-în-adâncime faŃă de precedenta sunt următoarele: - elementele stivei sunt acum formate din pereche de genul , unde nod este un nod al arborelui, iar cale este o secvenŃă de noduri, configurând o soluŃie parŃială, între rădăcină si nod; - singurul apel recursiv al funcŃiei se detaliază acum în două apeluri pentru că trebuie făcută diferenŃa între cazurile în care nodul curent are ori nu descendenŃi Dacă el nu are descendenŃi (succ == Æ), atunci calea nu se Cristea, IoniŃă, Pistol – InteligenŃa Artificială 102 modifică, pentru că practic stiva reculează cu nodul curent, ce fusese scos prin operaŃia pop Dacă are descendenŃi, atunci în stivă se includ perechi formate din fiecare nod descendent si calea corespunzătoare la care se adaugă nodul descendent (prelungirea căii vechi cu nodul nou este notată path ° n, pentru a sugera o concatenare); - valoarea întoarsă este, de data asta, o cale iar nu un simplu nod Apelul iniŃial trebuie acum să fie de forma: recGetPathDepthFirstSearch(push ,Æ) În aceeasi manieră, funcŃia de căutare întâi-în-lărgime devine: procedure recGetPathBreadthFirstSearch(queue) begin if empty(queue) then return FAIL; (node,path) ,queue)); end cu apelul iniŃial recGetPathBreadthFirstSearch(in ,Æ) În fine, varianta ce se preocupă de generarea soluŃiei pentru funcŃia de căutare celmai- bun-întâi devine: procedure recGetPathBestFirstSearch(list) begin if empty(list) then return FAIL; (node,path) ,list); recGetPathBestFirstSearch(sort(list)); end al cărei apel iniŃial trebuie să fie exprimat ca: recGetPathBestFirstSearch(include ,Æ) În această variantă a procedurii de căutare cel-mai-bun-întâi, se presupune că funcŃia sort sortează perechi pe baza strict a scorurilor nodurilor, deci fără a se preocupa de căile atasate - Recuperarea soluŃiei în metodele de căutare euristică pe grafuri Algoritmul A* Mai avem de rezolvat o problemă, si anume, cum se face recuperarea căii atunci când structura e un graf iar nu un arbore Problema revine la calculul drumurilor de cost minim în grafuri, considerată o problemă clasică de căutare în grafuri, dar, în acelasi timp, si o problemă de IA În general, în problemele de acest Cristea, IoniŃă, Pistol – InteligenŃa Artificială 103 gen, aprecierea costurilor este făcută de o funcŃie euristică f care exprimă costul ca o sumă a două valori: g – un cost al traversării grafului din nodul start până în nodul curent, si h – un cost al estimării traversării grafului din nodul curent până într-un nod final: f = g + h Toate valorile funcŃiilor g si h trebuie să fie pozitive Evident că precizia funcŃiei euristice reflectă cantitatea de informaŃie pe care ea o incorporează relativ la domeniul problemei O funcŃie h identic nulă reflectă lipsă totală de informaŃie asupra problemei (cazul în care nu se poate face nici o estimare asupra aproprierii de soluŃie a unei stări) Următoarea procedură este o variantă a căutării best-first, cunoscută sub numele de algoritmul A (Hart, et al , 1968) Procedura generează atât o parte a grafului stărilor problemei cât si un subset al său numit arbore de căutare (asadar, în care fiecare nod are un unic părinte) La fiecare pas al iteraŃiei exterioare, nodurile din open reprezintă noduri frunză ale arborelui de căutare În derularea algoritmului, nu numai că arborele de căutare se extinde în graful generat dar îsi poate schimba si forma în asa fel încât unele noduri îsi modifică părinŃii Când o frunză a arborelui de căutare atinge un nod final, atunci căutarea se termină si pentru că fiecare nod al acestui arbore îsi cunoaste părintele, soluŃia este dată de calea inversă de la nodul final la nodul de start procedure A(start-node) begin start-node back-score = 0; start-node forth-score = euristics(start-node); /* Presupunem că atasăm fiecărui nod trei faŃete: /* back-score – costul căii de la rădăcină la nod; /* forth-score – aprecierea costului de la nod la destinaŃie; /* father – nodul lui părinte în drumul spre soluŃie open 2) Asta înseamnă că drumul până la G ca A-B-C-F-G este mai lung decât cel găsit anterior ca A-B-G Din acest motiv părintele nodului G nu se schimbă Să luăm însă exemplul grafului din Figura 3 19 si să considerăm că, dintr-un motiv oarecare, funcŃia euristică pe care o avem la dispoziŃie apreciază ca forthscore pentru nodurile F si J valoarea 20, valorile tuturor celorlalte noduri fiind 10 Atunci evoluŃia algoritmului ar fi dată de Tabelul 3 3 Figura 3 19: Un spaŃiu al stărilor reprezentat ca graf în care arborele de căutare evoluează cu reveniri A B C D 1 G F E 2 3 5 4 K J I H 8 6 7 0 7 1 2 3 2 5 3 4 6 a Pasii 1-8 A B C D G F E K J I H 0 7 1 2 3 2 5 3 4 5 4 6 9 10 6 11 b Pasii 9-11 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 107 Tabelul 3 3: Derularea algoritmului în caz de revenire asupra deciziilor (pe spaŃiul stărilor din Figura 3 19) Pas current-node pairs:{(node,score)} open closed 0 (A) Æ 1 A (A f=nil, A bs=o, A fs=7) ((B,1)) B f=A, B bs=1, B fs=10 (B) (A) 2 B ((C,1),(G,1)) C f=B, C bs=2, C fs=10 G f=B, G bs=2, G fs=10 (C,G) sortată: (C,G) (A,B) 3 C ((D,1),(F,1)) D f=C, D bs=3, D fs=10 F f=C, F bs=3, F fs=20 (G,D,F) sortată: (G,D,F) (A,B,C) 4 G () (D,F) sortată: (D,F) (A,B,C,G) 5 D ((E,1)) E f=D, E bs=4, E fs=10 (F,E) sortată: (E,F) (A,B,C,G,D) 6 E ((F,1),(H,1)) H f=E, H bs=5, H fs=10 (F,H) sortată: (H, F) (A,B,C,G,D,E) 7 H ((I,1)) I f=H, I bs=6, I fs=10 (F,I) sortată: (I,F) (A,B,C,G,D,E,H) 8 I ((J,1)) J f=I, J bs=7, J fs=20 (F,J) sortată: (F,J) (A,B,C,G,D,E,H,I ) 9 F ((G,1)(I,1)) I f=F, I bs=4, I fs=10 updateDescScores(I) J f=I, J bs=5 (J) (A,B,C,G,D,E,H,I ,F) 10 J ((K,1)) K f=J, K bs=6, K fs=10 (K) (A,B,C,G,D,E,H,I ,F,J) 11 K – goal(K)=TRUE () () (A,B,C,G,D,E,H,I ,F,J,K) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 108 În Figura 3 19a se prezintă pasii 1-8 Datorită valorii mare a funcŃiei euristice nodul F a fost ocolit în parcurgere, fiind trecut la fiecare sortare a listei open în coada ei (pasii 3-7) În Figura 3 19b sunt daŃi pasii 9-11 În momentul în care nodul F devine nod curent are loc o rearanjare a valorii de back-score a nodului I, descendent al lui F si valoarea acestuia este corectată de la 6 la 4 Această reasezare poate influenŃa toate nodurile ce pot fi atinse din F si care fuseseră deja calculate Apelul funcŃiei updateDescScores(I) realizează acest lucru Ca urmare si valoarea nodului J se modifică de la 7 la 5 Să observăm că dacă ceea ce interesează e numai găsirea unei căi spre soluŃie, atunci putem face g(n)=0 în fiecare nod n După cum am văzut în cele două exemple de mai sus, dacă dorim cea mai scurtă cale spre soluŃie, atunci g(n)=nr de pasi până în n (costul unei căi = 1) si rezultatul e similar unei căutări breadth-first Dacă fiecare operator are un alt cost, si se doreste cea mai ieftină cale, atunci g poate oglindi costul căii Dacă algoritmul A foloseste o funcŃie euristică h care este o limită inferioară a costului căii optime de la un nod n la Ńintă, atunci el se numeste A* Următoarele rezultate se cunosc despre A* (v Nilsson, 1980): • A* se termină întotdeauna în grafuri finite; • dacă o cale există de la nodul start la o soluŃie, atunci A* se termină (chiar dacă graful e infinit); • A* e admisibil (adică, dacă există o cale de la nodul de start la un nod soluŃie, A* găseste o cale optimă) Spunem că un algoritm A2 e mai informat decât A1, dacă, pentru toate nodurile n diferite de soluŃie, h2(n) > h1(n) • Dacă A1 si A2 sunt două versiuni ale lui A*, astfel încât A2 e mai informat decât A1, atunci la terminarea căutărilor lor pe orice graf în care există o cale de la nodul start la un nod soluŃie, orice nod expandat de A2 este de asemenea expandat si de A1 Urmează că A1 expandează cel puŃin tot atâtea noduri ca si A2 3 4 Sisteme Expert 3 4 1 Tipuri de căutări Am văzut în acest capitol câteva metode de a organiza o căutare în spaŃiul stărilor pentru găsirea soluŃiei unei probleme de IA Maniera de căutare a fost întotdeauna dinspre o stare considerată iniŃială către o stare considerată finală, fie că stim cu exactitate acea stare, fie că o cunoastem doar prin anumite condiŃii care sunt verificate de ea Parcurgerea spaŃiului stărilor este deci întotdeauna “către înainte” (forward-looking), sau plecând de la premize pentru a ajunge la o concluzie Dar aceasta nu e singura posibilitate: la fel de bine putem adopta o manieră de căutare care pleacă dinspre concluzie pentru a verifica dacă avem premize care s-o verifice Maniera se numeste “căutare înapoi” (backward-looking) Limbajul Prolog implementează o astfel de strategie In sfârsit se poate vorbi si de o căutare bidirecŃională, în care se pleacă simultan dinspre premize si concluzie în încercarea de a găsi o cale care să le unească Cristea, IoniŃă, Pistol – InteligenŃa Artificială 109 3 4 2 Sistemele Expert (SE) Un Sistem Expert este un program capabil de a încorpora si folosi cunostinŃe echivalente cu cele pe care le are un expert uman într-un anumit domeniu Un shell (sau o “carapace”) de SE este ceea ce ar rămâne dintr-un SE dacă l-am goli de cunoasterea expert El este, asadar, un sistem de control capabil de a efectua o căutare într-un spaŃiu al stărilor, de aceea se mai numeste si motor de inferenŃe Premiza principală în construcŃia unui SE este aceea că un expert îsi construieste soluŃia la o problemă din piese elementare de cunoastere pe care le selectează si le aplică într-o anumită secvenŃă Pentru a furniza o soluŃie coerentă la o problemă dată cunoasterea cuprinsă într-un anumit domeniu trebuie asadar formalizată, apoi reprezentată corespunzător si în final manipulată în conformitate cu o anumită metodă de rezolvare de probleme Se pune astfel în evidenŃă diviziunea dintre secŃiunea care păstrează reprezentarea cunoasterii asupra domeniului – baza de cunostinŃe, formată dintr-o colecŃie (bază) de fapte împreună cu o colecŃie (bază) de reguli si diviziunea responsabilă cu organizarea proceselor inferenŃiale care să implice aceste cunostinŃe – sistemul de control Un shell foarte cunoscut de SE este CLIPS (Giarratano, Riley, 1998) 3 5 Concluzie Rezolvarea unei probleme de IA are două aspecte: • formalizarea problemei = găsirea unei reprezentări pentru stările problemei si găsirea unei reprezentări pentru reguli; • lansarea unei căutări în spaŃiul stărilor în scopul determinării unei căi între starea considerată iniŃială si o stare finală Când un astfel de drum nu poate fi găsit spunem că problema nu are soluŃie Aceste concluzii pun în evidenŃă si preocupările majore ale domeniului: găsirea celor mai adecvate procedee de reprezentarea a problemelor, respectiv găsirea celor mai eficiente procedee de navigare în spaŃii ale stărilor CerinŃe pentru studenŃi: • Să recunoască încadrarea unei probleme în clasa de probleme IA • Să deosebească o problemă de o ipostază de problemă • Să identifice spaŃiul stărilor problemei si să-i aprecieze mărimea • Să construiască o reprezentare adecvată a stărilor • Să identifice regulile si să construiască o reprezentare neformală a lor • Să hotărască asupra unui tip de căutare a soluŃiei • Să poată adapta algoritmul la cerinŃele particulare ale problemei Cristea, IoniŃă, Pistol – InteligenŃa Artificială 110 Probleme P3 1 Recuperarea soluŃiei: să se modifice algoritmii hill-climbing() si rec-hillclimbing() din secŃiunea 3 3 1 pentru a-i face să întoarcă: a) o secvenŃă de stări prin care se trece în drumul de la starea iniŃială până la cea finală; b) o secvenŃă de operatori care aplicaŃi stării iniŃiale să ducă la obŃinerea stării finale P3 2 Aceleasi cerinŃe pentru algoritmii backtracking-hill-climbing() si recbacktracking- hill-climbing() din secŃiunea 3 3 2 P3 3 Să se figureze un arbore a soluŃiei pentru instanŃa problemei cuburilor dată în Figura 3 20, în care funcŃia euristică adaugă, pentru fiecare bloc, 1 – dacă stă pe blocul pe care ar trebui să ajungă si scade 1 – dacă nu stă pe blocul pe care ar trebui să ajungă Operatorii sunt cei cunoscuŃi din secŃiunea 3 2 2 Figura 3 20: O instanŃă a problemei cuburilor cu cinci piese P3 4 Să se descrie funcŃia updateDescScores(node) din componenŃa algoritmului A (v secŃiunea 3 3 2) P3 5 Să se descrie funcŃia generatePath(current-node, start-node) din componenŃa algoritmului A (v secŃiunea 3 3 2) P3 6 Se dă o gramatică independentă de context si o frază a) Să se precizeze diferenŃa dintre o problemă si o instanŃă de problemă în acest caz b) Să se dea exemple de alte instanŃe ale aceleiasi probleme c) Să se explice ce înseamnă o stare în rezolvarea acestei probleme si care e reprezentarea unei stări d) Să se formalizeze ca o problemă de căutare în spaŃiul stărilor problema recunoasterii dacă fraza face parte din limbajul generat de gramatică e) Ce strategie consideraŃi adecvată pentru rezolvare? f) Să se dea exemple de două soluŃii posibile (derivări) Exemplu pentru: G = {NT, T, S, P}, unde: NT = {S, NP, VP, N, V} T = {calul, lacrimă, duce}, iar B C D a starea iniŃială b starea finală E A A B C D E Cristea, IoniŃă, Pistol – InteligenŃa Artificială 111 P = {S  NP VP, NP  NP NP, NP  N, VP  V NP, VP  V, N  calul, N  lacrimă, N  duce, V  duce, V  lacrimă} si propoziŃia: "calul duce lacrimă" P3 7 În testele de inteligenŃă apar probleme în care este dată o secvenŃă de numere si se cere să se găsească formula prin care se determină succesorul Vi se cere să rezolvaŃi prin mijloace specifice IA o astfel de problemă DescrieŃi un algoritm care să găsească o soluŃie a unei astfel de probleme, presupunând existenŃa unei proceduri stripsSearch(n1,n2), unde n1 si n2 sînt două numere din secvenŃă Procedura stripsSearch() realizează o căutare într-un spaŃiu al stărilor în care n1 este o stare iniŃială iar n2 – una finală, căutând o cale de aplicaŃii de reguli O regulă în această formalizare transformă un număr într-un alt număr Procedura stripsSearch() întoarce o listă de secvenŃe de reguli Numărul de aplicaŃii ale procedurii stripsSearch() este dat de numărul de secvenŃe consecutive de două numere ce se cuprind în secvenŃa originală După fiecare apel al procedurii stripsSearch() numărul de secvenŃe de reguli rămas trebuie să fie mai mic sau cel mult egal cu cel anterior În mod ideal, la terminarea acestei faze, o singură cale trebuie să rămână SoluŃia problemei va trebui dată de aplicarea căii asupra ultimului număr din secvenŃa dată P3 8 Pentru a controla explozia exponenŃială care poate să apară în anumite probleme de investigare a spaŃiului stărilor, se recurge la o îngrădire a listei nodurilor ce vor fi exploatate, reŃinând la fiecare pas primii N cei mai promiŃători candidaŃi Varianta se numeste beamsearch DescrieŃi un astfel de algoritm de căutare pe arbori P3 9 Să se găsească o reprezentare adecvată pentru o stare în jocul de sah si apoi să se modeleze mutările calului si ale nebunului P3 10 a) DescrieŃi în Lisp regula M-right prin care un singur misionar se deplasează pe malul din dreapta Forma generală a regulii trebuie să fie: if CONDIłII then ACłIUNI; b) DescrieŃi o funcŃie de scor pentru problema canibalilor si misionarilor; c) Poate problema misionarilor si canibalilor să aibă o rezolvare printr-un algoritm de tip hillclimbing? ExplicaŃi P3 11 Să se formalizeze ca o problemă de căutare în spaŃiul stărilor următoarea problemă de aliniere: se dau două semnale, fiecare fiind format dintr-o secvenŃă de segmente de linie dreaptă aflate unul în prelungirea celuilalt (ca în Figura 3 21) Fiecare segment e caracterizat de o lungime (pe axa orizontală) si o pantă Se doreste să se obŃine cea mai bună aliniere între cele două semnale În evaluarea unei alinieri contează lungimea segmentelor si panta acestora Figura 3 21: Alinierea a două semnale codificate ca secvenŃe de linii frânte P3 12 Se consideră un joc ce se desfăsoară pe o tabla 3 × 3 pe care sunt plasate piese albe si negre (Figura 3 22) Fiecare dintre cei doi jucători are asignată câte o culoare La o mutare, un jucător poate selecta un dreptunghi, piesele din interiorul dreptunghiului urmând să-si schimbe culoarea Câstigă primul jucător care obŃine pe tablă toate piesele în culoarea lui Cristea, IoniŃă, Pistol – InteligenŃa Artificială 112 Figura 3 23: Starea iniŃială a jocului a) Să se propună un set de predicate care să facă posibilă descrierea stărilor jocului Cu ele să se definească starea iniŃială (figura din stânga) si starea finală b) Să se propună reguli pentru modelarea miscărilor jucătorilor c) Să se propună o funcŃie de evaluare a unei stări si un algoritm de control P3 13 Se dă o tablă de sah pe care se găsesc iniŃial plasaŃi cai Ei se deplasează, utilizând salturile caracteristice calului din jocul de sah, întotdeauna spre hambar (colŃul din stânga sus al tablei) Miscările se termina când unul din cai reuseste să ajungă în hambar a) Să se propună un set de predicate care să fie utilizate în reprezentarea unei stări si, cu ajutorul lor, să se descrie o stare iniŃială b) Să se descrie un set de reguli care să realizeze mutările cailor c) Să se descrie o secvenŃă de mutări care să conducă spre soluŃie P3 14 Doi parteneri, A si B, stau faŃă în faŃă: B si-a pus în minte un număr între 1 si 10 pe care A trebuie să-l ghicească A propune numere iar B răspunde prin “da”, “mai mic” sau “mai mare” a) FormulaŃi acest dialog ca o problemă IA b) DescrieŃi secvenŃa de reguli aplicate si de stări generate când B alege numărul 7 P3 15 Într-un joc pe calculator intervin următoarele elemente: • un omuleŃ, care este un obiect usor dar dur, se poate misca în toate direcŃiile, poate împinge obiecte si mânca inimioare, când se află lângă acestea; • două bile, care sînt obiecte dure si grele; • bombă, care poate exploda dacă un obiect dur cade peste ea sau dacă ea cade peste un obiect dur, caz în care se autodistruge si distruge orice obiect aflat în imediata apropiere; • inimioară, care este un obiect dur si greu; • cinci parcele de pajiste care sînt obiecte moi ce se distrug la trecerea omuleŃului; • un balon, care poate înălŃa un singur obiect greu dar care e susŃinut de pajiste; • usă, care se deschide când omuleŃul a mâncat inimioara Un obiect greu poate cădea atunci când nu e susŃinut Un obiect usor nu cade a) Să se imagineze un set de predicate cu ajutorul cărora să se reprezinte starea din Figura 3 23 b) Să se descrie acŃiunile posibile din acest mic univers ca un set de reguli de producŃie c) Să se imagineze secvenŃa de aplicări de reguli prin care omuleŃul poate iesi prin usă P3 16 DescrieŃi într-un eseu elementele de inteligenŃă artificială pe care vi le imaginaŃi incorporate în casa viitorului (max 2 pagini) DaŃi cît mai multe indicaŃii de modelare Figura 3 22: O secvenŃă de trei mutări în evoluŃia jocului Cristea, IoniŃă, Pistol – InteligenŃa Artificială 113 P3 17 Ceea ce urmează reprezintă formularea unui joc numit Lives si atribuit matematicianului John Conway de la Univ Cambridge: Există a tablă pătrată (presupus infinită) pe care se pot dezvolta celule Fiecare poziŃie de pe tablă poate evolua în funcŃie de starea ei si a celor opt vecini ai săi conform a trei reguli: 1 SupravieŃuire Orice celulă vie care se învecinează cu două sau trei alte celule vii supravieŃuieste 2 Moarte Orice celulă vie care se învecinează cu patru sau mai multe celule vii moare de suprapopulare Orice celulă vie care se învecinează cu una sau nici o celulă vie moare de izolare 3 Nastere În orice locaŃie goală care se învecinează cu exact trei celule vii va apare o celulă vie Toate regulile se calculează întâi pentru fiecare celulă si se aplică odată pentru a da nastere la următoarea generaŃie a tablei Într-o anumită implementare a jocului prin reguli de producŃie, s-a preferat o reprezentare în care pentru fiecare locaŃie de coordonate (x, y) a tablei se cunosc, la orice moment, următoarele predicate: • current-value(x,y,v) – cu semnificaŃia că valoarea curentă a locaŃiei este v Î{empty, cell}; • new-value(x,y,v) – cu semnificaŃia că valoarea la generaŃia următoare a locaŃiei trebuie să fie v Î{empty, cell}; • neighbour(x,y,n) – cu semnificaŃia că numărul de celule vii învecinate locaŃiei este n (0£n£8); • tested(x,y,t) – cu semnificaŃia că locaŃia este deja calculată pentru noua generaŃie (t = true), ori nu (t = false) - DescrieŃi un set de operatori care guvernează evoluŃia simulată a jocului PrecizaŃi mecanismele suplimentare de control si reprezentare de care aveŃi nevoie pentru secvenŃierea fazelor; - DescrieŃi prin setul de predicate precizat anterior următoarea stare iniŃială: Figura 3 24: Starea iniŃială a jocului LIFE - DescrieŃi o secvenŃă de reguli care produc două generaŃii de celule plecând de la starea iniŃială precizată si arătaŃi care va fi configuraŃia ultimei generaŃii din cele două Bibliografie Cristea, D 2002 Programarea bazată pe reguli Ed Academiei, Bucuresti • • • Cristea, IoniŃă, Pistol – InteligenŃa Artificială 114 Giarratano, J Riley, G 1998 Expert Systems: Principles and Programming, 3rd Edition, PWS Publishing Hart, P E , Nilsson, N J , Raphael, B 1968 A Formal Basis for the Heuristic Determination of Minimum Cost Paths IEEE Transactions on Systems Science and Cybernetics, Vol 4, No 2, 1968, pp 100-107 Nilson,N 1980 Principles of Artificial Intelligence Morgan Kaufmann Cristea, IoniŃă, Pistol – InteligenŃa Artificială 115 Capitolul 4 Reprezentarea cunoasterii si raŃionament Bine, atunci: care e viteza întunericului? Wright Stevens Realitatea este tot ceea ce ne înconjoară La baza interacŃiunii noastre, ca sisteme vii, cu realitatea stau necesităŃile si dorinŃele noastre Credem că sediul acestor imbolduri este creierul nostru si tot acolo realitatea trebuie să fie reflectată într-un anume fel La masă fiind, întindem mâna după solniŃă, o apucăm si o scuturăm deasupra grătarului de vită din farfurie, după care o asezăm la loc Facem toate acestea mai întâi pentru că „ne place” mâncarea mai sărată si apoi pentru că „vrem” să ne satisfacem acest gust Apoi „stim” că sarea se află în solniŃă, că o putem face să iasă din solniŃă si presăra peste mâncare prin scuturare deasupra ei, că pentru a aduce solniŃa deasupra farfuriei trebuie să o apucăm cu mâna, să o răsturnăm deasupra farfuriei si să o scuturăm, după care, în mod normal, trebuie să o repunem pe masă de unde am luat-o Suntem apoi capabili să „recunoastem” solniŃa undeva pe masă În fine putem să “controlăm” miscările mâinii, întâi îndreptând-o spre locul unde se află solniŃa, apoi deschizând palma ca pentru a apuca între degete, apoi apucând solniŃa cu mâna, retrăgând-o până solniŃa ajunge deasupra farfuriei, întorcând mâna si scuturând-o atât cât “credem” că ne trebuie sare si făcând apoi toate miscările în sens invers pentru a depune înapoi solniŃa pe masă de unde am luat-o Toate aceste acŃiuni sunt atât de banale încât le facem purtând un dialog cu partenerul de masă despre un subiect care nu are nimic în comun cu condimentarea fripturii din faŃa noastră, reflex, aproape fără să ne concentrăm la ceea ce facem Dar toate ghilimelele din paragraful de mai sus, comportă acte si stări cognitive, care compun un tablou extrem de spectaculos Dacă ar trebui să-l detaliem, am recunoaste următoarele componente: • realitatea, adică noi, masa, solniŃa, sarea, farfuria, friptura etc , este formată din obiecte care sunt independente unele de altele Acestea se supun legilor fizicii, de exemplu ocupă locuri în spaŃiu, nu e posibil ca două dintre ele să se afle în acelasi loc în acelasi moment si sunt grele, adică cad dacă nu sunt sprijinite de un suport Datorită unui complex de împrejurări oarecare, acestea se găsesc toate într-o vecinătate uman sesizabilă, la momentul desfăsurării scenei; • noi avem plăceri, dorinŃe, nevoi Aceste stări de spirit sunt motoarele acŃiunilor pe care le iniŃiem Fără ele am adăsta, inerŃi ca niste legume, ca vântul să ne mute si ploaia să ne ude; • noi avem cunostinŃe despre foarte multe lucruri, printre altele si despre ceea ce este normal să existe si să se întâmple în realitate Aceste cunostinŃe reprezintă o memorie a lucrurilor văzute, povestite ori citite De exemplu putem găzdui în această memorie relaŃii între obiecte care se Cristea, IoniŃă, Pistol – InteligenŃa Artificială 116 află în câmpul nostru vizual si altele care nu se află acolo Astfel, ”stim” că, în mod normal, sarea se află în solniŃă, mai ”stim” cum arată o solniŃă, adică care e forma ei, si ”stim” că sarea e sărată, adică are acel gust care dorim să-l completeze pe cel al fripturii În acelasi timp cunoastem acŃiunea de ”a pune sare în mâncare la masă” pentru că am repetat-o de atâtea ori până acum Dacă nu am avea această cunoastere, încă ar fi posibil să ne satisfacem nevoia de sare (desi autorul nu o recomandă cu prea aprinsă căldură cititorilor săi), pentru că, înzestraŃi cu inteligenŃă cum ne aflăm, am putea corela anume cunostinŃe pentru a rezolva pentru prima oară această problemă, eventual din câteva încercări Cu alte cuvinte o experienŃă de acest tip, trăită, primită ori descoperită, este evocată în memoria noastră ca soluŃia la nevoia de a avea friptura sărată; • rezultatul va fi construirea unui plan care să particularizeze cunoasterea de natură generală, la detaliile mesei si aranjării obiectelor aflate în faŃa noastră În particularizarea planului, crucială este ”recunoasterea” solniŃei pe masă, desi este pentru prima oară când vedem această solniŃă anume Reusim să identificăm solniŃa pe masă pentru că ea seamănă atât de mult cu forma pe care stim că ar trebui să o aibă o solniŃă Dacă, din obscure motive, solniŃa de pe masa noastră ar avea forma si dimensiunile unei mingi de baschet, e greu de crezut că am reusi să o identificăm; • în fine, planul este pus în aplicare, creierul comandă mâinii secvenŃa tuturor acelor miscări si urmăreste realizarea lui, controlând permanent poziŃia mâinii cu imaginea primită în ochi Dacă, după ce am localizat solniŃa pe masă, am încerca să ne ducem la îndeplinire planul cu ochii închisi, am avea mari sanse să apucăm în locul solniŃei piperul pe care să-l scuturăm în paharul cu vin EsenŃială în acest scenariu este reprezentarea realităŃii în memoria noastră Fără această reprezentare, nu am recunoaste situaŃia drept una deja întâlnită, nu am putea particulariza secvenŃa de acŃiuni la realităŃile locului pentru a construi un plan si prin urmare am rămâne cu friptura nesărată În acest capitol vom trece în revistă câteva tipuri de reprezentări ce se aplică sistemelor de IA 4 1 Ontologii În filosofie, cuvântul „ontologie” desemnează un punct de vedere sistematic asupra ExistenŃei El este împrumutat de IA unde este utilizat cu semnificaŃia de specificare a unei conceptualizări (Gruber, 1993, Gruber, 2003) Cu alte cuvinte o ontologie reprezintă o descriere a conceptelor si a relaŃiilor ce sunt stabilite între acestea pentru a servi unui agent sau unei comunităŃi de agenŃi Scopul ontologiei este definirea regulilor formale care să permită unei comunităŃi de agenŃi să interpreteze în acelasi mod un segment al realităŃii (deci al existenŃei) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 117 4 2 Taxonomii Taxonomia este un tip particular de ontologie Într-o taxonomie, concepte mai puŃin generale sunt definite în funcŃie de concepte mai generale, acestea – în funcŃie de altele încă mai generale decât ele s a m d MulŃimea conceptelor este structurată în ierarhii (taxonomii) RelaŃia taxonomică este una de mostenire de proprietăŃi si se notează ISA (de la is a din engleză), AKO (a kind of), SUBSET, MEMBER etc 13 Dacă x ISA y spunem că y este părinte pentru x, iar x este fiu al lui y De asemenea vom spune că orice părinte al lui x ca si orice părinte al unui părinte al lui x este un predecesor pentru x, si recursiv – orice părinte al unui predecesor al lui x este predecesor al lui x Reciproc, un fiu este un descendent, la fel ca si un fiu al unui fiu si un fiu al unui descendent Iată un exemplu de ierarhie, notată grafic ca în Figura 4 1: câine ISA mamifer pisică ISA mamifer mamifer ISA animal peste ISA animal animal ISA entitate vie copac ISA entitate vie entitate vie ISA obiect fizic obiect fizic ISA entitate fizică Datorită tranzitivităŃii relaŃiilor ISA, din aceste relaŃii se pot deduce cel puŃin următoarele: câine ISA animal câine ISA entitate vie câine ISA obiect fizic câine ISA entitate fizică pisică ISA animal pisică ISA entitate fizică mamifer ISA entitate vie mamifer ISA entitate fizică peste ISA entitate vie peste ISA entitate fizică animal ISA obiect fizic animal ISA entitate fizică copac ISA obiect fizic copac ISA entitate fizică entitate vie ISA entitate fizică Figura 4 1: Un exemplu de taxonomie NoŃiunea de concept din reŃelele semantice este asimilabilă celei de clasă din reprezentările orientate obiect Numele atasate conceptelor sunt convenŃii de notaŃie si nu sunt suficiente pentru a individualiza conceptele între ele O reprezentare semantică satisfăcătoare trebuie să individualizeze conceptele prin descrieri 13 Unele sisteme fac deosebire între relaŃiile ierarhice aplicate la nivelul conceptelor (numite acolo SUBSET) si cele dintre instanŃe si concepte (numite ISA) (v de exemplu (Tufis, Cristea, 1985)) mamifer cîine pisică peste animal copac entitate vie obiect fizic entitate fizică Cristea, IoniŃă, Pistol – InteligenŃa Artificială 118 specifice, proprietăŃi caracteristice Descrierea unui concept este dată de relaŃii de natură semantică atasate acestuia În reprezentările noastre grafice, relaŃiile semantice vor fi figurate prin săgeŃi simple etichetate cu numele lor, în timp de relaŃiile de natură taxonomică (ISA) vor fi reprezentate prin săgeŃi îngrosate (ca în Figura 1) sau duble, unind conceptele (sau instanŃele lor) de ascendenŃii imediaŃi Într-o astfel de ierarhie, conceptele mai particulare se spune că mostenesc proprietăŃile celor mai generale Pentru că reprezentările noastre sunt, în esenŃă, grafuri, adesea ne vom referi la conceptele sau instanŃele ce le populează cu numele generic de noduri iar relaŃiile dintre ele vor fi arcele care unesc nodurile NoŃiunea de concept nu poate fi identificată cu mulŃimea instanŃelor sale pentru că un concept este format nu numai din mulŃimea instanŃelor cunoscute (înregistrate la un moment dat) ale acestuia dar si de oricâte altele (necunoscute dar posibile) ce ar putea satisface proprietăŃile atasate lui De exemplu conceptul de persoană fizică este constant indiferent de câte instanŃe ale acestuia sunt cunoscute la un moment dat Deci un concept ar putea fi văzut ca reuniunea unei mulŃimi de instanŃe fizice cu una de instanŃe virtuale, aceasta din urmă – de cardinal neprecizat, potenŃial infinit MulŃimile (concrete ori virtuale) ale obiectelor asociate conceptelor nu sunt neapărat disjuncte De exemplu conceptul de programator si cel de bărbat se intersectează si ambele sunt conŃinute în cel de om Într-o reprezentare ca mulŃimi, situaŃia poate fi redată ca în Figura 4 2a, în timp ce, într-o reprezentare comună reŃelelor semantice, aceleasi relaŃii sunt redate ca în Figura 4 2b Figura 4 2: De la mulŃimi de instanŃe la concepte 4 3 Paternitate versus monotonie în sisteme ierarhice Într-un sistem ierarhic mostenirea proprietăŃilor este caracterizată de două dimensiuni: • paternitatea – cu simplă ori multiplă mostenire Într-un sistem cu simplă mostenire nici un nod nu poate avea mai mult decât un singur părinte, pe când într-un sistem cu mostenire multiplă există cel puŃin un nod care are cel puŃin doi părinŃi; programator bărbat om programator bărbat om Ion a b Cristea, IoniŃă, Pistol – InteligenŃa Artificială 119 • monotonia – mostenirea proprietăŃilor este monotonă dacă fiecare nod mosteneste toate proprietăŃile părinŃilor si nici o nouă proprietate adăugată pe un nivel inferior nu poate contrazice una omonimă ei declarată în ierarhie pe un nivel superior Dimpotrivă, într-un sistem nemonoton o proprietate, dacă apare de mai multe ori, este culeasă din predecesorul cel mai apropiat Astfel, în reŃeaua din Figura 4 3, presupunând că relaŃiile taxonomice sunt reprezentate prin săgeŃi îngrosate, proprietăŃile – prin arce orizontale subŃiri etichetate si că valoarea unei proprietăŃi este dat de nodul în care ajunge arcul respectiv, vom găsi că proprietatea R1 a nodurilor C0 si C1 este C4, nu C5 si nici C9, si aceeasi proprietate R1 a nodului C2 este C5, iar nu C9 La fel, proprietatea R2 a nodului C4 si C5 este C7, iar nu C9 Dacă am cere valoarea proprietăŃii dată de o cale vidă de relaŃii a nodului x ar trebui să-l obŃinem pe x Figura 4 3: O ierarhie nemonotonă Cele două coordonate, fiecare având două valori posibile ne dau patru tipuri de sisteme Acestea sunt explicitate în cele ce urmează: • sistem monoton cu o singură mostenire: fiecare entitate are un singur părinte si orice entitate în ierarhie mosteneste toate proprietăŃile părinŃilor; • sistem nemonoton cu o singură mostenire: fiecare entitate are un singur părinte si dacă o proprietate este repetată în mai multe locuri în ierarhie, valoarea cea mai de jos este cea care primează; • sistem monoton cu mostenire multiplă: o entitate poate avea mai mulŃi părinŃi si orice entitate în ierarhie mosteneste toate proprietăŃile părinŃilor; • sistem nemonoton cu mostenire multiplă: o entitate poate avea mai mulŃi părinŃi si, dacă o proprietate este repetată în mai multe locuri în ierarhie, aceeasi relaŃie poate fi comunicată de mai mulŃi părinŃi R1 C3 C1 C2 C5 C0 C4 C6 C8 C9 C7 R2 R3 R1 R2 R1 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 120 4 3 1 SoluŃii în cazul mostenirilor contradictorii Pentru că o reprezentare de tip nemonoton în care se acceptă mostenirea multiplă poate genera contradicŃii sau ambiguităŃi pe motivul că aceeasi proprietate poate fi mostenită cu valori diferite din doi sau mai mulŃi părinŃi distincŃi, una din următoarele soluŃii poate fi adoptată: • să se adopte o regulă de mostenire ortogonală în proiectarea reŃelei: informaŃia este partiŃionată între nodurile părinŃi astfel încât nici o proprietate să nu poate fi mostenită de la mai mult decât un singur nod părinte; • să se stabilească o regulă de prioritate între nodurile ascendenŃi, astfel încât, dacă aceeasi proprietate apare din mai multe locuri, ordinea dată regula de prioritate să fie cea care să indice informaŃia mostenită Astfel, în ierarhia de clase a CLOS cât si a sistemului ELU (Estival, 1990), (Russel et al , 1992) este adoptată regula întâi-în-adâncime si de-lastânga- la-dreapta În Figura 4-4 “ },y); ; Procedura recursivă findPathRec() primeste doi parametri: ; - o structură de coadă în care fiecare intrare este o pereche ; formată dintr-un nod (în care s-a ajuns cu căutarea) si o cale ; de relaŃii de la nodul de start până la el: ; ; - nodul destinaŃie ; Structura de coadă este necesară pentru o abordare a căutării ; întâi-în-lărgime, ceea ce asigură calea de adâncime minimă ; în termeni de relaŃii taxonomice accesate end procedure findPathRec(queue, y) begin if (null(queue)) then return FAIL; }; } listParents }); ; calea de la nodul start până la oricare din părinŃii lui x este ; aceeasi cu calea de la nodul start până la x } return findPathRec(in(queue, newEntries),y); ; În apelul recursiv coada apare incrementată cu noile intrări end - Găsirea unei valori prin navigare pe o cale de relaŃii Întrebarea este formulată astfel: plecând de la nod X să se găsească nodul y la care se poate ajunge (prin mostenire) în lungul căii de relaŃii ISA*•R1•ISA*• •ISA*•Rk (pe scurt, ?y: x ISA*•R1•ISA*•…•ISA*•Rk y)? procedure getValueOnPath(x, listRel) begin getValueOnPathRec({ }); ; Procedura recursivă getValueOnPathRec() primeste o structură de ; coadă în care fiecare intrare din este o pereche formată ; dintr-un nod (în care s-a ajuns cu căutarea) si calea ; de relaŃii care au mai rămas de parcurs; ; Structura de coadă este necesară pentru o abordare a căutării ; întâi-în-lărgime, ceea ce asigură respectarea condiŃiei ; de mostenire a proprietăŃilor end procedure getValueOnPathRec(queue) begin if null(queue) then return FAIL; }; } listParents }); ; calea de la nodul start până la oricare din părinŃii lui x este ; aceeasi cu calea de la nodul start până la x } Cristea, IoniŃă, Pistol – InteligenŃa Artificială 127 getValueOnPathRec(in(queue, newEntries)); ; În apelul recursiv coada apare incrementată cu noile intrări end - Căutare combinată în reŃeaua conceptuală si referenŃială Acest tip de interogare urmăreste regăsirea instanŃei unui concept plecând dintr-o altă instanŃă Pentru aceasta se urcă întâi în reŃeaua conceptuală din instanŃa dată, se determină calea care uneste părintele conceptual găsit cu conceptul destinaŃie si se coboară din nou în reŃeaua referenŃială pentru a se determina instanŃa aflată în capătul căii de relaŃii care au acelasi nume cu cele găsite în reŃeaua conceptuală, plecând din instanŃa dată Astfel dacă x este instanŃa dată si C conceptul al cărei instanŃă se doreste a se afla, răspunsul este dat de următorul lanŃ de trei interogări: ?Cx: x ISA Cx (se cere părintele conceptual al instanŃei x) ?R*: Cx R* C (se cere calea de relaŃii in reŃeaua conceptuală care uneste părintele lui x de conceptul destinaŃie C) ?y: x R* y (răspunsul la întrebare este dat de instanŃa care se află în capătul căii omonime de relaŃii, plecând din x) Să urmărim pe Figura 4 9 răspunsul reŃelei la întrebarea: Care este densitatea corpului Cub2? ?CCub2: Cub2 ISA CCub2  CCub2 = cub ?R*: cub R* densitate  R* = e-făcut-din • are-dens ?y: Cub2 e-făcut-din • are-dens y  y = 0 8 4 4 3 Demoni Demonii sunt proceduri care nu se apelează ci se activează singure când anumite condiŃii pe care ei sunt pregătiŃi să le sesizeze sunt îndeplinite Cu alte cuvinte, un demon este întotdeauna gata să-si ofere serviciile, atunci când cineva are nevoie de ele Un demon poate fi într-una din stările: adormit, disponibil (idle) sau activ Când e adormit, demonul nu este la curent asupra modificărilor ce se petrec în lume Când e disponibil el supraveghează schimbările ce apar si este sensibil la ele, putând să decidă dacă lumea s-a schimbat în asa fel încât serviciile pe care poate el să le pună la dispoziŃie devin utile Când este activ demonul lucrează, depune rezultatul în lume, modificând-o, după care revine iar în starea disponibil Doar un alt proces poate să decidă când un demon disponibil trebuie să adoarmă si când un demon adormit trebuie trezit, pentru a deveni disponibil Ca exemplu de utilizare a demonilor în reŃele semantice, să ne imaginăm că în reŃeaua pe care am proiectat-o deja ne interesează să stim si masa corpurilor Putem înscrie în reŃea aceste informaŃii în două moduri: cântărind corpurile si atasând valorile maselor în nodurile instanŃă respective, ori construind un demon care devine activ numai când această informaŃie lipseste si care e capabil să deducă masa prin calcul utilizând formula: m=r*V Această din urmă variantă presupune interogarea reŃelei pentru aflarea densităŃii si a volumului corpurilor În exemplul Cristea, IoniŃă, Pistol – InteligenŃa Artificială 128 nostru, procedura de calcul a masei, realizată ca un demon, este atasată nodului conceptual obiect-fizic, prin intermediul faŃetei demon a proprietăŃii are-masă În aceeasi manieră se pot atasa proceduri-demoni de calcul a volumelor diferitelor corpuri geometrice În Figura 4 9 acest lucru s-a realizat prin atasarea faŃetelor demon proprietăŃilor arevol ale nodurile cilindru si cub Pentru a înŃelege felul în care un demon preia singur o sarcină spre rezolvare când e disponibil, să vedem mai întâi care e maniera uzuală în care are loc interogarea reŃelei, urmărind reprezentarea din Figura 4 9 Astfel, instanŃei Cub1 îi este atasată masa în mod explicit, prin relaŃia are-masă indicând valoarea 2 500 g Pentru instanŃa Cub2 nu se cunoaste masa direct, dar ea poate fi calculată din faptul că se stie că materialul din care e făcut este lemnul si se cunoaste volumul acestui corp (1 000 cm3) În sfârsit, pentru Cilindru1 nu se cunoaste nici masa si nici volumul, dar se stie că e un cilindru făcut din fier, că raza bazei este de 3 cm, iar înălŃimea de 10 cm Procedurile de tip demon amintite mai sus sunt: procedure ComputeMass(x) begin ; află densitatea lui x: ?Cx: x ISA Cx ?R1*: Cx R1* densitate ?y1: x R1* y1 ; află volumul lui x: ?R2*: Cx R2* volum ?y2: x R2* y2 ; calculează masa ca densitate * volum: return y1 * y2; end procedure ComputeVolCube(x) begin ; află latura lui x: ?y: x are-latură y ; calculează volumul: return y * y * y; end procedure ComputeVolCylinder(x) begin ; află raza bazei lui x: ?r: x are-rază r ; află înălŃimea lui x: ?h: x are-înălŃime h ; calculează volumul: return 3 14 * r * r * h; end Pentru a exemplifica intervenŃia demonilor, să încercăm să răspundem la întrebarea: Ce masă are cilindrul 1?: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 129 ?y: Cilindru1 ISA y  y = cilindru ?R*, cilindru R* masă  R* = are-masă ?y, Cilindru1 are-masă y  nil  demon: ComputeMass(Cilindru1)  ?Cx: Cilindru1 ISA Cx  Cx = cilindru  ?R1*: cilindru R1* densitate  e-făcut-din • are-dens  ?y1: Cilindru1 e-făcut-din • are-dens y1  2 4  ?R2*: cilindru R2* volum  R2* = are-vol  ?y2: Cilindru1 are-vol y2  nil  demon: ComputeVolCylinder(Cilindru1)  ?r: Cilindru1 are-rază r  r = 3 ?h: Cilindru1 are-înălŃime h  h = 10  282 6  678 24 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 130 Figura 4 9: Demonii reprezentaŃi ca noduri procedurale în reŃele semantice Având la bază mecanismul descris în această secŃiune, în anii ’80 a fost construit sistemul IURES15 (Tufis&Cristea, 1985), (Tufis et al , 1989), care era capabil să răspundă la întrebări adresate de un utilizator în limba română AplicaŃiile dezvoltate cu IURES au vizat baza de date naŃională de programe, o bază de date geografice etc 4 4 4 AmbiguităŃi în reprezentarea prin reŃele semantice Se cunoaste că reŃelele semantice prezintă anumite slăbiciuni în modelarea lumilor statice de genul celor prezentate mai sus (Sowa, 1999) Astfel, dacă, ignorând anumite detalii, o relaŃie generală precum ”tatăl unei persoane este si ea o persoană” se reprezintă ca în Figura 4 10a, în care, conform convenŃiilor de mai sus, 15 ÎnŃeleg Usor Româneste Eliminând Sintaxa (I Understand and Reply Eliminating Syntax) ReŃea semantică conceptuală computeMass e-făcutdin material densitate aredens are-vol aredens are-dens are-masă (demon) masă ReŃea semantică referenŃială cub computeVolCube dimensiun e are-latură are-rază areînălŃime cilindru făcut-din făcut-din Cub1 fier lemn 0 8 2 4 are-masă obiect-fizic are-vol (demon) are-masă volum 2500 1000 are-vol Cub2 10 3 areînălŃime are-rază făcut-din Cilindru1 computeVolCylinder are-vol (demon) corpgeometric Cristea, IoniŃă, Pistol – InteligenŃa Artificială 131 săgeata plină semnifică o relaŃie ISA iar cea subŃire – o relaŃie semantică În aceste condiŃii să vedem cum putem reprezenta o afirmaŃie precum ”tatăl unei persoane o iubeste pe mama acelei persoane”? Figura 4 10: Reprezentări pentru a ”tatăl unei persoane este persoană” b ”tatăl o iubeste pe mama” O reprezentare precum cea din Figura 4 10b poate fi defectuoasă într-o interpretare în care relaŃiile de la acest nivel sunt înŃelese ca fiind mostenite între conceptele ori instanŃele aflate pe niveluri ierarhic inferioare Într-adevăr, presupunând că Ion este un tată iar Maria o mamă, adică o situaŃie ca cea din Figura 4 11, nu am vrea să tragem concluzia că Ion o iubeste pe Maria, decât în cazul în care ei ar fi tatăl, respectiv mama, unei aceleiasi persoane În (Thomason, Touretzky, 1991) se prezintă un sistem formal de reprezentare prin reŃele semantice care evită ambiguităŃi de genul celor puse în evidenŃă în exemplul care urmează Figura 4 11: Necazuri cu reprezentarea din Figura 4 10b O altă posibilitate ar fi însoŃirea relaŃiilor de condiŃii ce ar trebui să fie verificate asupra oricărei perechi de instanŃe care particularizează conceptele unite de relaŃie De exemplu, în cazul acestui exemplu, condiŃia atasată relaŃiei iubeste ar trebui să fie: iubeste(x,y) Ü $a, ISA(a,persoană) Λ are-tată(a,x) Λ are-mamă(a,y) 4 5 ReŃele semantice evenimenŃiale InferenŃe Când utilizăm limbajul pentru comunicare, realizăm continuu inferenŃe Le facem fără nici un efort aparent; ele rezultă direct din înlănŃuirea logică a evenimentelor comunicate, din experienŃa de viaŃă pe care am acumulat-o si din iubeste are-mamă are-tată persoană mamă Maria tată Ion iubeste are-mamă are-tată persoană mamă tată are-tată persoană tată a b Cristea, IoniŃă, Pistol – InteligenŃa Artificială 132 cunoasterea sensurilor cuvintelor Să încercăm să găsim o explicaŃie pentru care următoarele două propoziŃii citite ori auzite în secvenŃă au sens: 1 Maria a scăpat oul din mână 2 Ea a trebuit să cureŃe apoi pardoseala În efortul de a înŃelege acest text efectuăm un dublu lanŃ de inferenŃe: unul pleacă dinspre prima frază: Maria scapă oul din mână  când nu mai este susŃinut de mână oul cade  în cădere oul atinge la un moment dat pardoseala  la atingerea pardoselii, oul se sparge  prin spargere, oul îsi varsă conŃinutul pe pardoseală  conŃinutul lichid al oului se află pe pardoseală  conŃinutul oului pe pardoseală e perceput de Maria ca o murdărie iar al doilea lanŃ de inferenŃe are ca origine cea de a doua frază: Ea = Maria trebuie să cureŃe pardoseala  Maria gândeste că se impune curăŃarea pardoselii  Maria percepe pardoseala ca fiind murdară În felul acesta găsim un fapt folosit în comun de cele două lanŃuri inferenŃiale: faptul că Maria gândeste că pardoseala este murdară, ceea ce explică textul si prin aceasta îl face coerent Alte inferenŃe însoŃesc de asemenea acest text: înainte de a fi scăpat, oul era Ńinut în mână de Maria; Maria nu a avut intenŃia să scape oul; Maria este necăjită că a pierdut un ou si că a făcut un efort ca să facă iar pardoseala curată Gândim toate aceste lucruri fără a le folosi în vreun fel, cu excepŃia cazului în care suntem obligaŃi de apariŃia altor exprimări ce ni le solicită pentru a fi, la rândul lor, înŃelese De exemplu, dacă prima fraza a exemplului dat mai sus, ar fi urmată de: 2a Ea punea ouăle pe care tocmai le cumpărase din sacosă în frigider atunci fraza 2a, ca să fie înŃeleasă, trebuie să fie însoŃită de următoarele inferenŃe: 1: Maria scapă oul din mână  dacă scap din mână un ou, anterior trebuie să-l fi Ńinut în mână 2a: Ea = Maria transferă ouă din sacosă în frigider  Maria ia unul sau mai multe ouă în mână si îl (le) depune în frigider  dacă iau în mână un ou înseamnă că Ńin în mână oul un timp Din nou două lanŃuri inferenŃiale se unesc într-un fapt comun: Maria Ńine un ou în mână Acest fapt contribuie la înŃelegerea lui 2a în contextul în care 1 fusese pronunŃat Cum putem simula aceste procese de inferenŃă? Cristea, IoniŃă, Pistol – InteligenŃa Artificială 133 4 5 1 Evenimente aflate în corelaŃie logică ImplicaŃia logică (entailment, în engleză) reprezintă o componentă inferenŃială esenŃială Evenimentele aflate în relaŃie de implicaŃie logică sunt fie simultane, fie în secvenŃă unul faŃă de altul (cel obŃinut, inferat, este anterior celui presupus) (v Figura 4 12) Exemple de implicaŃii logice: - dacă scap un obiect din mână înseamnă că anterior Ńineam acel obiect în mână; - dacă sforăi înseamnă că dorm; - dacă iese fum înseamnă că undeva arde ceva; - dacă îmi cer scuze pentru un lucru înseamnă că admit că am făcut acel lucru; - dacă sunt asezat înseamnă că anterior m-am asezat RelaŃia de implicaŃie logică nu trebuie confundată cu relaŃia de cauzalitate între evenimente În general evenimentele cauză preced temporal pe cele efect: (Figura 4 13) - dacă plouă rezultă că pământul va fi ud; - dacă mă asez înseamnă că în foarte scurt timp voi fi asezat; - dacă vopsesc un obiect înseamnă că obiectul va avea o altă culoare; - dacă scap un obiect din mână atunci acel obiect cade Există o diferenŃa dintre cauzalitatea din natură si reflectarea ei cognitivă Întrucât abordarea noastră este una legată de interpretarea textelor, în acest studiu nu ne interesează să modelăm realitatea ci doar maniera în care reflectăm realitatea în procesul lecturii Ce am dat mai sus sunt câteva reguli cauzale “de bun simŃ” (common-sense) si ele pot neglija unele aspecte legate de fizică Asa bunăoară, căderea corpurilor presupune un câmp gravitaŃional de care Ńinem seama implicit în reprezentările noastre Dacă însă ne-am plasa într-un mediu în care acesta ar lipsi, am avea nevoie de un timp în care reprezentările noastre mintale să sufere corecŃii prin confruntare cu experienŃele ce contrazic reprezentările După un timp vom fi înlocuit aceste reprezentări cu altele De exemplu: - dacă scap un obiect din mână atunci acel obiect rămâne lângă mână Al treilea tip de relaŃie logică între evenimente este aceea de plauzibilitate (plausibility): - dacă un obiect cade este plauzibil ca un obstacol să oprească căderea la un moment dat; axa timpului Figura 4 12: PoziŃionarea în timp a evenimentelor aflate în implicaŃie logică axa timpului Figura 4 13: PoziŃionarea în timp a evenimentelor implicate în relaŃie cauzală Cristea, IoniŃă, Pistol – InteligenŃa Artificială 134 - dacă un ou este lovit de un anumit obiect dur este plauzibil ca oul să se spargă; - dacă vorbesc este plauzibil că cineva mă ascultă; - dacă cineva doarme este plauzibil ca el să sforăie RelaŃia de plauzibilitate este una abductivă: ea reprezintă o inversare a relaŃiei de implicaŃie logică Pentru a o explica, cineva a formulat următoarea analogie: imaginaŃi-vă că sunteŃi în casă si priviŃi pe fereastră ramurile unui pom aflat în grădină Dacă cineva scutură pomul veŃi vedea ramurile lui tremurând Avem de-a face cu o implicaŃie logică Acum să presupunem că vedem ramurile pomului tremurând Dacă presupunem că acest lucru are loc pentru că cineva scutură pomul spunem că am făcut o abducŃie Concluzia nu este sigură, ci doar probabilă, pentru că ramurile pomului pot să tremure si din cauză că le scutură vântul, de exemplu RelaŃia de plauzibilitate este mai mult una de analogie De multe ori la aflarea unui eveniment ne trec prin minte cauze probabile ale lui Nu toate inferenŃele de acest tip sunt la fel de probabile De exemplu, între cele de mai sus, ultima este cel mai puŃin probabilă Din punct de vedere al dispunerii în timp, evenimentul plauzibil inferat poate fi plasat simultan, anterior sau posterior celui presupus (Figura 4 14) Revenind asupra exemplului de mai sus detaliem următoarele inferenŃe: Maria scapă oul din mână CAUSE oul cade PLAUSIBLE oul se loveste de un obiect PLAUSIBLE oul se sparge CAUSE conŃinutul oului se varsă PLAUSIBLE conŃinutul oului ajunge pe obiect PLAUSIBLE Maria percepe conŃinutul oului pe obiect PLAUSIBLE Maria gândeste conŃinutul oului pe obiect ca o murdărire a obiectului PLAUSIBLE Maria este afectată negativ de acest gând Alte inferenŃe sunt de asemenea posibile, dar nu le detaliem aici 4 5 2 Un model inferenŃial În cele ce urmează propunem un model de dezvoltare a inferenŃelor în reŃele semantice, model capabil să dea o explicaŃie înŃelegerii textelor Ne interesează procesele semantice, deci vom ignora orice tratament sintactic aplicat textului Modelul presupune existenŃa unei memorii de lungă durată ce conŃine reprezentări ale cadrelor evenimenŃiale ale diferitelor sensuri ale verbelor Sensurile verbelor, substantivelor, adjectivelor si adverbelor sunt totodată individualizate în ierarhii conceptuale în maniera WordNet (Fellbaum, 1998) Modelul simulează constientizarea “citirii printre rânduri”, a “subînŃelegerii” lanŃului de evenimente care leagă două situaŃii ori evenimente redate de text, utilizând o memorie de scurtă durată Această memorie este organizată ca o reŃea semantică, fiind populată cu noduri evenimenŃiale, instanŃe ale verbelor-concepte axa timpului Figura 4 14: PoziŃionarea în timp a evenimentelor implicate în relaŃie de plauzibilitate Cristea, IoniŃă, Pistol – InteligenŃa Artificială 135 predefinite în memoria de lungă durată Evenimentele rămân în această memorie atât cât e nevoie pentru “prinderea” înŃelesului, adică realizarea unui lanŃ inferenŃial capabil să găsească legătura dintre două fraze ce apar consecutiv în discurs Odată realizat acest lucru, memoria de scurtă durată este eliberată de nodurile ce au contribuit la acest proces, însă anumite rezultate ce sunt considerate “importante” pot fi eventual transferate în memoria de lungă durată Un pas inferenŃial poate să aibă loc fie direct, prin parcurgerea unei relaŃii implicaŃionale, cauzale ori plauzibile plecând dintr-un eveniment realizat, fie indirect, parcurgând mai întâi prin mostenire unul sau mai multe niveluri ierarhice din reprezentarea statică a unui tip de eveniment si efectuând apoi o implicaŃie logică, cauzală ori plauzibilă În cele ce urmează vom detalia acest proces pentru simularea “înŃelegerii” exprimării din exemplul prezentat mai sus Întâi câteva reguli inferenŃiale: RC scăpa (regulă cauzală cu a scăpa): ori de câte ori o persoană scapă un obiect, obiectul va cădea (v Figura 4 15) Desi, definirea rolurilor de AG (agent – cel mare face acŃiunea), REC (receptor – cel asupra căruia se răsfrânge acŃiunea), OB (obiectul angrenat în acŃiune), este până la urmă o chestiune de convenŃie, atâta vreme cât nu există reguli specifice general aplicabile unor anumite roluri semantice, vom conveni să considerăm ca participând în postură de AG entităŃile care sunt activ implicat într-o acŃiune sau o situaŃie, în postură de REC – pe cele implicate pasiv, iar în postură de OB – pe cele care intermediază realizarea evenimentului Din acest punct de vedere, persoana care scapă obiectul este un activ si deci joacă rolul de AG, obiectul scăpat este un pasiv, asupra lui manifestându-se acŃiunea de scăpare, deci este un REC Figura 4 15: O regulă cauzală cu a scăpa RP cădea (regulă plauzibilă cu a cădea): dacă un obiect cade este plauzibil ca după un timp el să atingă repede un obstacol – care este un obiect (v Figura 4 16) Figura 4 16: O regulă plauzibilă cu a cădea AG REC REC plausible a atinge Y-obiect X-obiect a cădea repede MOD a scăpa persoană AG obiect REC REC a cădea cause X Y Cristea, IoniŃă, Pistol – InteligenŃa Artificială 136 RP lovi1 (regulă plauzibilă cu a lovi): dacă un obiect fragil loveste un alt obiect dur este plauzibil ca obiectul fragil să se spargă (Figura 4 17) Figura 4 17: O regulă plauzibilă cu a lovi Urmând a ne sluji de ea mai târziu, să mai adăugăm în acest punct o regulă plauzibilă cu a lovi, de data acesta în care agentul este un lichid RP lovi2: dacă un lichid loveste un obiect este plauzibil să credem că lichidul va fi întins pe acel obiect (Figura 4 18) Figura 4 18: Dacă un lichid loveste un obiect, e plauzibil să inferăm că lichidul va fi întins pe obiect RC sparge (regulă cauzală cu a se sparge): dacă un recipient se sparge si el conŃine un lichid, este cauzal adevărat că lichidul se va revărsa din recipient (Figura 4 19) Să urmărim marcarea recipientului si a lichidului pe roluri REC în evenimentele de spargere si revărsare, ca fiind pasiv implicate în ele REC dur AG REC plausible a se sparge Y-obiect ATR X-obiect a lovi fragil ATR REC dur AG REC plausible a fi întins Y-obiect ATR X-lichid a lovi ON Cristea, IoniŃă, Pistol – InteligenŃa Artificială 137 Figura 4 19: O regulă cauzală cu a se sparge Vom vedea imediat că aceste reguli de “recunoastere a realităŃii din jurul nostru” încă nu sunt suficiente pentru a modela procesul inferenŃial din exemplul nostru Deocamdată să mai adăugăm cunoasterea că un ou este (si) un recipient, în sensul de Ńinător de substanŃă16 De asemenea, putem vedea a se revărsa ca un fel particular de a cădea în care receptorul acŃiunii este un lichid Dacă adoptăm această plasare ierarhică17, atunci din vărsarea conŃinutului rezultă prin regula de plauzibilitate RP cădea că acesta va atinge un obstacol InferenŃa este una indirectă si rezultă din compunerea a doi pasi: unul de mostenire si celălalt cauzal În continuare vom detalia maniera în care aceste reguli se pot combina pentru a forma un lanŃ inferenŃial 1 Maria a scăpat oul din mână Prima propoziŃie provoacă apariŃia unui eveniment cu verbul a scăpa (Figura 4 20) ApariŃia unui eveniment cu a scăpa va amorsa un proces care verifică pattern-urile inferenŃiale (implicaŃionale, cauzale si plauzibile) atasate acestui verb Figura 4 20: Evenimentul nou apărut ev1 16 În WordNet 1 6 o astfel de informaŃie lipseste Un ou e privit numai din punctul de vedere biologic, ca celulă ce poate da viaŃă InformaŃia morfologică, ce pune în evidenŃă constituŃia sa de “Ńinător” de substanŃă vâscoasă, este ignorată 17 Din nou WordNet 1 6 nu clasifică a vărsa (leak, flow, pour) ca fiind în relaŃie de hiponimie cu a cădea (to fall) REC REC cause X-container a se sparge a se revărsa Y-lichid CONTAINS FROM ev1 Maria AG REC oul1 a scăpa mână1 FROM PART-OF ISA Cristea, IoniŃă, Pistol – InteligenŃa Artificială 138 Procesul general este acela în care apariŃia unui eveniment al unui verb (concept) provoacă apariŃia unor evenimente legate prin relaŃii inferenŃiale de acel verb FuncŃionarea în acest mod poate fi pusă pe seama unei meta-reguli de forma: MRCause if isEvent(ev1, conc1) and isCauseRule(RC, conc1, conc2) and verifies(ev1, RC) then born(ev2, conc2) Această meta-regulă (meta – pentru că ea se aplică unei clase întregi de reguli cauzale) spune că dacă apare un eveniment ev1, instanŃă a unui concept conc1 (isEvent – este un predicat cu comportament de demon, el verificând existenŃa unui eveniment dintr-o clasă dată) si dacă există o regulă cauzală RC în care conceptul conc1 apare ca iniŃiator si conceptul conc2 ca rezultat si dacă evenimentul ev1 verifică restricŃiile semantice ale părŃii stângi a regulii RC, atunci se va crea un eveniment ev2, instanŃă a conceptului conc2, împreună cu toate legăturile si obiectele noi implicate de instanŃierea părŃii drepte a regulii RC Meta-regula MRCause poate fi aplicată la apariŃia evenimentului ev1 al verbului (concept) a scăpa (isEvent(ev1, conc1) este instanŃiat de ev1 = ev1 si, conc1 = a scăpa) pentru că există o regulă cauzală a lui a scăpa (isCauseRule(RC, conc1, conc2) este verificată de RC = RC scăpa, conc1 = a scăpa, conc2 = a cădea), si restricŃiile semantice atasate rolurilor AG si REC sunt verificate de, respectiv, Maria, care este o persoană, si oul1, care este un obiect (adică verifies(ev1, RC scăpa) se evaluează la true) Activarea meta-regulii MRCause va determina apariŃia unui nou eveniment, ev2, care trebuie să fie unul al verbului a cădea si în care rolul REC trebuie să fie satisfăcut de aceeasi entitate care satisface rolul REC al evenimentului precedent cu a scăpa, adică oul1 (v Figura 4 21) Figura 4 21: Evenimentul nou apărut ev2 În mod analog pot fi puse în evidenŃă alte două meta-reguli, care descriu respectiv inferenŃele implicaŃionale si pe cele plauzibile: MRImplies if isEvent(ev1, conc1) and isImplyRule(RI, conc1, conc2) and verifies(ev1, R) then born(ev2, conc2) MRPlausible if isEvent(ev1, conc1) and isPlausibleRule(RP, conc1, conc2) and verifies(ev1, R) then born(ev2, conc2) ev2 REC oul1 ISA a cădea Cristea, IoniŃă, Pistol – InteligenŃa Artificială 139 Mai departe, apariŃia unui eveniment al verbului a cădea, prin efectul metaregulii MRPlausible, atrage declansarea regulii RP cădea (v Figura 4 16) Aceasta duce la crearea (cu un anumit grad de incertitudine, datorat naturii plauzibile iar nu sigure a ei) a unui eveniment al verbului a atinge (v Figura 4 22) În acest fel un obiect (necunoscut deocamdată) este creat El este notat aici cu Xobiect Figura 4 22: Evenimentul nou apărut ev3 al conceptului a atinge Până acum trei evenimente noi populează spaŃiul inferenŃial al memoriei de scurtă durată ApariŃia lor simulează constientizarea situaŃiilor de scăpare din mână a oului, de cădere a acestuia cât si a faptului că, în cădere, acesta atinge un obiect Să observăm că prima propoziŃie nu pune în evidenŃă obiectul de care se va lovi oul: la fel de bine el ar fi putut fi un scaun, colŃul mesei sau pălăria unui trecător aflat sub balconul pe care s-ar fi putut petrece acest episod… Cât de departe trebuie să mergem cu lanŃul inferenŃial? Cât de multe inferenŃe facem? Oricâte, sau numai câte sunt necesare pentru înŃelegerea textului Există o limită rezonabilă unde am putea opri acest lanŃ? PreocupaŃi, în textul de faŃă, de găsirea unui model al înŃelegerii în profunzime a textelor, vom ignora deocamdată întrebări de acest gen, ce Ńin de “gestionarea” procesului inferenŃial18 Preocuparea noastră, deocamdată, este de a arăta că un astfel de lanŃ se poate închide firesc pe un rezultat care include una dintre accepŃiunile posibile ale textului Un mod particular de atingere este lovirea Astfel WordNet 2 119 raportează un sens al lui to hit ca troponim (sens particular) al verbului to touch (invers, to touch este considerat un hiperonim al lui to hit): touch (make physical contact with, come in contact with; "Touch the stone for good luck"; "She never touched her husband"; "The two buildings almost touch") => strike, hit (produce by manipulating keys or strings of musical instruments, also metaphorically; "The pianist strikes 18 Un tip de control poate fi acela în care inferenŃele se desfăsoară tot timpul, în paralel cu citirea textului Fiecare frază amorsează noi lanŃuri inferenŃiale iar unele lanŃuri aflate în desfăsurare se pot închide atunci cînd se regăsesc evenimente introduse deja de alte lanŃuri Aceste evenimente, apărute redundant, constituie semnale că un înŃeles a fost construit Scoruri de “satisfacŃie” pot fi imaginate care să dea o imagine a gradului de înŃelegere a textului 19 Tezaurul lexical Wordnet, construit la Universitatea din Philadelphia, poate fi consultat si download-at la adresa http//www upenn edu/~wn ev3 AG oul1 REC X-obiect ISA a atinge repede MOD Cristea, IoniŃă, Pistol – InteligenŃa Artificială 140 a middle C"; "strike `z' on the keyboard"; "her comments struck a sour note") O manieră generală în care dintr-un concept mai general se poate obŃine, prin particularizare, unul mai specific, este dată de următoarea meta-regulă: MRHypernim if isEvent(ev1, conc1) and isHypernimDueToRoles(conc1, conc2, Roles) and verifiesRoles(ev1, Roles) then born(ev2, conc2) care spune că dacă există un eveniment ev1 aparŃinând conceptului conc1 si dacă conc1 este un hiperonim cunoscut al conceptului conc2 si dacă particularizarea lui conc1 în conc2 se face prin rolurile Roles cu anumite valori atasate si dacă evenimentul ev1 verifică rolurile Roles, atunci se crează un eveniment ev2 al conceptului mai particular conc2 în care apar de asemenea valorile rolurilor Roles Figura 4 23 arată că rolul care particularizează a atinge în a lovi este MOD cu valoarea repede Ca urmare a aplicării metaregulii de hiperonimie, apariŃia evenimentului ev3 duce de asemenea la apariŃia evenimentului ev4, al conceptului a lovi (v Figura 4 24) În acest eveniment, un obiect de care oul s-a lovit în cădere este presupus (notat în Figura 4 24 cu X-obiect) Încă nu stim ce poate fi acest obiect Identitatea lui va fi relevată mult mai târziu, în virtutea menŃionării podelei în fraza 2 din exemplul nostru Figura 4 23: A lovi înseamnă a atinge repede Figura 4 24: Avem acum un eveniment cu a lovi AG X-obiect REC a atinge Y-obiect repede MOD ISA AG REC a lovi ev4 oul1 AG REC X-obiect ISA a lovi Cristea, IoniŃă, Pistol – InteligenŃa Artificială 141 În continuare, în virtutea regulilor RP lovi si RC sparge si a metaregulilor MRPlausible si MR Cause cât si a cunoasterii faptului că un ou este un obiect fragil de tip container care conŃine un lichid, două noi eveniment sunt construite (v Figura 4 25) Figura 4 25: Constientizăm spargerea oului (ev5) si revărsarea conŃinutului său (ev6) Pentru a exemplifica maniera în care o regulă de bun simŃ se poate aplica de mai multe ori, vom face presupunerea că dispunem de cunoasterea de semantică lexicală care clasează verbul a se revărsa ca o formă particulară de cădere, ca în Figura 4 26 Figura 4 26: Dacă un lichid cade înseamnă că el se revarsă În virtutea aplicării meta-reguli MRHypernim din nou, existenŃa evenimentului ev6 va duce la apariŃia unui eveniment al verbului a cădea, iar aplicarea recursivă a regulii de bun simŃ RP cădea, va da nastere, în aceeasi manieră ca si mai înainte, la un eveniment cu a atinge (v Figura 4 27) a se sparge fragil ATR ev5 REC oul1 ISA REC a se revărsa YCONTAINS FROM ev6 ISA REC a cădea Y-lichid ISA REC a se revărsa Cristea, IoniŃă, Pistol – InteligenŃa Artificială 142 Figura 4 27: ConŃinutul oului cade si atinge (rapid) un obiect Să remarcăm că X-obiectul de care se loveste oul nu este necesar să fie acelasi cu Z-obiectul de care se loveste lichidul Mai departe însă, pentru că AG-ul evenimentului cu a atinge nu mai este un obiect ci un lichid, regula RP lovi nu poate fi aplicată încă o dată O altă regulă pragmatică trebuie să funcŃioneze, capabilă să infereze că dacă un lichid loveste un obiect, atunci lichidul se întinde pe obiect (v RP lovi2 si Figura 4 28) Ca urmare o situaŃie în care conŃinutul oului este întins pe acest obiect pe care l-a atins în cădere va apare în memoria de scurtă durată: Figura 4 28: ConŃinutul oului este întins pe un obiect Exemplul poate fi continuat până la atingerea unei stări în care Maria gândeste conŃinutul oului pe obiect ca o murdărire a obiectului si ea este afectată negativ de acest gând În mod analog, un proces va fi iniŃiat din fraza a doua a exemplului considerat Cum un proces de curăŃare este datorat perceperii unei murdării, iar necesitatea de a o curăŃa, unei stări negative insuflată de ea, va exista un moment în care cele două lanŃuri inferenŃiale se ating pe o stare comună Acest fapt comun, indus de o frază si presupus de cealaltă, este liantul care face ca exprimarea să fie coerentă Când un astfel de proces se derulează într-o masină, atunci suntem îndreptăŃiŃi a spune că masina a „înŃeles” exprimarea CerinŃe pentru studenŃi:  Să fie capabili să producă o reprezentare a cunoasterii dintr-un univers dat  Să recunoască necesitatea utilizării unei reŃele semantice descriptive sau a uneia evenimenŃiale, în funcŃie de problemă  Să poată adapta ori produce un algoritm care să ofere posibilitatea obŃinerii de inferenŃe în reŃele semantice MOD REC OB a atinge Z-obiect Y-lichid a cădea rapid ev7 ISA ev8 ISA AG a sta întins ev9 REC ISA YON Z-obiect Cristea, IoniŃă, Pistol – InteligenŃa Artificială 143 Probleme si proiecte de casă P4 1 Care dintre următoarele propoziŃii vi se par importante în definirea reŃelelor semantice (RS), care sunt adevărate si care false: - RS descriu relaŃii dintre obiecte reprezentate prin noduri; - nodurile în RS sunt cercuri cu nume; - cea mai importantă trăsătură a RS este mostenirea proprietăŃilor; - cea mai importantă trăsătură a RS este mostenirea multiplă; - ceea ce deosebeste RS de logica predicatelor de ordinul I (LPOI) este că în RS pot exprima Toate păsările zboară cu excepŃia pinguinului, pe când în LPOI nu; - atât în LPOI cât si în RS pot deduce din „Orice om e muritor Socrates este om ” că „Socrates este muritor ” P4 2 Să se reprezinte prin RS: - Un Boeing 747 este un avion - Avioanele si păsările zboară - Un vultur este o pasăre - Avioanele au motoare iar păsările pene - Avioanele au pilot si păsările cioc - Atât avioanele cât si păsările folosesc principii aerodinamice P4 3 StiŃi următoarele fapte despre lume: - cele mai multe fiinŃe nu zboară; - cele mai multe păsări, fiinŃe fiind, zboară; - pinguinii si struŃii, păsări fiind, nu zboară; - struŃii magici însă zboară; - Birco este o pasăre; - Zuicu este fie un pinguin, fie un struŃ; - CroŃ este un struŃ magic a) DaŃi o reprezentare a acestor cunostinŃe prin reŃele semantice descriptive b) Aplicând reguli de mostenire nemonotonă, răspundeŃi apoi la întrebările: − Birco zboară? − dar Zuicu? − dar CroŃ? − dar MoŃu? P4 4 StiŃi următoarele fapte despre lume si numai pe acestea: - bicicletele cântă, sunt prevăzute cu spiŃe si împletesc ciorapi; - caii, biciclete fiind, văd dar nu împletesc ciorapi pentru că sunt prevăzuŃi cu sei; - ochelarii, biciclete fiind, văd dar nu cântă pentru că nu sunt prevăzute cu spiŃe; - ochelarii de soare însă nu văd; - si oricine stie că lucrurile nu văd si nu pot cânta; - bicicletele, ca orice din lumea asta, sunt lucruri Să se enunŃe proprietăŃile calului lui Nero, ale bicicletei rosii din holul FacultăŃii, ale ochelarilor de soare ai domnului decan si ale Dunării albastre P4 5 Să se reprezinte cu ajutorul reŃelelor semantice cunoasterea din următorul text: Aorta este un tip particular de arteră care are un diametru de 2 5 cm O arteră este un vas de sânge, cu perete muscular si diametrul de 0 4 cm O venă e un vas de sânge cu pereŃi fibrosi Vasele de sânge au formă tubulară si conŃin sânge P4 6 InformaŃii asupra arborelui genealogic al unei familiei sunt descrise ca o reŃea semantică în care nodurile sunt persoane si legăturile sunt către părinŃi si (eventual) către fii Pentru orice persoană se cunoaste sexul DesenaŃi reŃeaua pentru arborele genealogic: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 144 Lili si Axinte sunt copiii lui Leana si Costel Florin si Ion sunt fiii lui Lili si Vasile Ioana e fata lui Maria si Axinte, iar Cornel e fratele său Pe unchiul lui Cornel îl cheamă Gigel a) DescrieŃi un mod de reprezentare a reŃelei semantice prin liste LISP b) ScrieŃi funcŃii LISP care să permită aflarea bunicilor si a verilor unei persoane P4 7 Să se completeze reŃeaua semantică relativă la corpuri geometrice dată la curs cu o piramidă PIRAM1 făcută din aluminiu (greutate specifică 2 7 g/cm3) si de volum 50 cm3 Să se arate care sunt interogările lansate asupra reŃelei de un apel al demonului computeMass(PIRAM1) P4 8 Să se reprezinte cunostinŃele din fraza următoare folosind reŃele semantice evenimenŃiale: Maria crede că lui Ion nu îi place să înoate, de aceea nu merge în vacanŃă la mare P4 9 CitiŃi următorul text: Maria a văzut un om intrând în casa ei Ea a chemat PoliŃia a DaŃi o reprezentare prin reŃele semantice evenimenŃiale a acestor două fraze b PrecizaŃi un set de reguli inferenŃiale care, aplicate în secvenŃă, să dea sens acestui text P4 10 AnalizaŃi-vă reacŃiile vis-à-vis de cele două secvenŃe de mai jos ExplicaŃi motivele acestor reacŃii ConstruiŃi un sistem capabil să reacŃioneze la fel ca dv A Mihai s-a dus la staŃie să facă plinul dar benzinarul i-a spus că nu mai are benzină B Mihai s-a dus la staŃie să facă plinul dar benzinarul i-a spus că nu mai are benzină în masină Bibliografie Barr, A and Feigenbaum, E A 1981 Handbook of Artificial Intelligence, (Eds ), William Kaufman, Inc , Los Altos, California, 409 pp, ISBN 0-86576-005-5, vol 1 Cristea, D 2002 Să ne jucăm cu cuvintele Proiecte de prelucrare a limbajului natural - 1, Revista de Informatică, nr 1, Iasi Fellbaum, C (ed ) 1998 WordNet An Electronic Lexical Database, The MIT Press Gruber, T R 1993 Toward principles for the design of ontologies used for knowledge sharing În „Formal Ontology in Conceptual Analysis and Knowledge Representation”, edited by Nicola Guarino and Roberto Poli, Kluwer Academic Publishers, Accesibilă la adresa: http://www cise ufl edu/~jhammer/classes/6930/XML-FA02/papers/gruber93ontology pdf Gruber, T R 2003 What is an Ontology V http://www-ksl stanford edu/kst/what-is-an-ontology html Sowa, J F , 1999 Knowledge Representation: Logical, Philosophical, and Computational Foundations, Brooks Cole Publishing Co Cristea, IoniŃă, Pistol – InteligenŃa Artificială 145 Thomason, R H , Touretzky, D S 1991 Inheritance Theory and Networks with Roles, în John Sowa (ed ): „Principles of Semantic Networks Explorations in the Representation of Knowledge”, Morgan Kaufmann Publishers, Inc , San Mateo Tufis,D ; Cristea,D 1985 IURES:A Human Engineering Approach To Natural Language Question- Answering Systems În Bibel,W ; Petkoff,B (Eds ) „Artificial Intelligence Methodology, Systems, Applications” North-Holland, Amsterdam, pag 177-184 Tufis, D , Giumale, C , Cristea, D 1989 Lisp Ed Tehnică, Bucuresti, vol 2 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 146 Capitolul 5 Probleme de satisfacere a constrângerilor Atunci când nu faci greseli, nu rezolvi probleme îndeajuns de complexe Si asta e o mare greseală Frank Wilczek 5 1 Introducere Faptul că satisfacerea constrângerilor s-a configurat actualmente ca un domeniu important si de sine stătător în informatica teoretică si aplicată este datorat multitudinii de situaŃii din lumea reală care pun pe tapet probleme ce impun respectarea simultană a mai multor cerinŃe O listă a domeniilor care abundă în astfel de probleme trebuie să includă: planificarea automată, configurarea resurselor, design, diagnosticare, raŃionare temporală si spaŃială etc Satisfacerea constrângerilor este acel subdomeniu al inteligenŃei artificiale care încearcă determinarea unei soluŃii practice cât mai bune dată fiind o listă de constrângeri si priorităŃi Formal, o problemă de satisfacere a constrângerilor (eng : constraint satisfaction problem – CSP) este definită printr-o reŃea de constrângeri O reŃea de constrângeri constă dintr-o mulŃime de variabile X={X1,…, Xn} si o mulŃime de constrângeri C={C1, , Ct} Fiecare variabilă Xi poate lua valori dintr-un domeniu Di O constrângere Ci este o relaŃie Ri definită pe o submulŃime de variabile si care determină asignări legale de valori ReŃeaua este referită printr-un triplet R=(X, D, C) O soluŃie pentru o astfel de problemă este o asignare de valori variabilelor astfel încât toate constrângerile să fie satisfăcute (Dechter, 2003; Tsang, 1993) Ca o observaŃie, în definiŃie nu se impune nici o condiŃie asupra tipului variabilelor Acestea pot fi întregi, logice, mulŃimi, sau de orice alt tip De asemenea, nici modul de definire a constrângerilor nu este limitat Constrângerile pot fi date atât explicit, prin specificarea tuplelor de valori permise, cât si implicit, prin relaŃii (ex: Xi > 2) O problemă pentru care există o soluŃie se numeste satisfiabilă sau consistentă În caz contrar, ea se numeste nesatisfiabilă sau inconsistentă Există situaŃii în care se doreste determinarea tuturor soluŃiilor, sau doar a uneia sau, în caz de inconsistenŃă, specificarea acestui lucru În practică, deseori este greu de determinat o asignare care să satisfacă toate constrângerile O extensie a problemei CSP este problema Max-CSP în care scopul este găsirea unei asignări cu număr minim de constrângeri violate În cazul în care constrângerile implică cel mult două variabile, numim problema CSP-binară O problemă de satisfacere a constrângerilor poate fi reprezentată printr-un graf, numit graf constrâns Pentru fiecare variabilă este asociat un nod, iar un arc este trasat între fiecare pereche de variabile conŃinute într-o constrângere Cristea, IoniŃă, Pistol – InteligenŃa Artificială 147 Exemplul 5 1: problema reginelor Dată fiind o tablă de sah n x n dorim să plasăm n regine pe tablă astfel încât nici o regină să nu fie atacată de nici o altă regină O posibilă formulare a problemei reginelor ca o problemă CSP ar fi următoarea: pentru fiecare coloană a tablei de sah asociem o variabilă Xi, iar domeniul variabilei sunt liniile, adică Di = {1, , n} Constrângerile sunt asociate fiecărei perechi de coloane si precizează următorul fapt: două regine nu se pot afla pe aceeasi linie sau pe aceeasi diagonală, ceea ce se exprimă prin relaŃiile: Xi ≠ Xj |Xi – Xj| ≠ |i-j|, pentru oricare i, j din intervalul 1, ,n Particularizând la n = 4, se obŃine problema celor 4-regine, în care variabilele sunt {X1, X2, X3, X4}, fiecare având domeniul {1, 2, 3, 4} Constrângerile sunt C1 = R12, C2 = R13, C3 = R14, C4 = R23, C5 = R24, si C6 = R34, date, în formă extensională, ca în Figura 5 1 Figura 5 1: Problema celor 4-regine ca o problemă de satisfacere a constrângerilor Graful constrâns este complet deoarece poziŃia unei regine pe o coloană influenŃează poziŃiile valide ale reginelor pe restul coloanelor Exemplul 5 2: Problema colorării hărŃii Dată o hartă cu n Ńări, să se asigneze câte o culoare dintr-o mulŃime dată fiecărei Ńări, astfel încât Ńările vecine să aibă culori diferite Asignăm fiecarei Ńări de pe hartă o variabilă care va avea ca domeniu mulŃimea de culori Între două Ńări vecine în graful constrâns vom adăuga un arc 1 2 3 4 Q Q Q Q X1 X2 X3 X4 R12 = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} R13 = {(1,2), (1,4), (2,1), (2,3), (3,2), (3,4), (4,1), (4,3)} R14 = {(1,2), (1,3), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), (4,2), (4,3)} R23 = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} R24 = {(1,2), (1,4), (2,1), (2,3), (3,2), (3,4), (4,1), (4,3)} R34 = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} Cristea, IoniŃă, Pistol – InteligenŃa Artificială 148 a) b) Figura 5 2: a) Problema colorării unei hărŃi cu 5 Ńări, culorile posibile fiind rosu, albastru si verde b) Graful constrâns Exemplul 5 3: Sudoku Cele mai răspândite puzzle-uri Sudoku sunt cele de ordin 3 Un astfel de puzzle constă dintr-o tablă de 9 x 9, în care fiecare pătrat poate avea un număr de la 1 la 9 Dată o asignare parŃială a tablei, scopul este de a completa poziŃiile rămase libere astfel încât fiecare număr să apară o singură dată pe o linie, pe o coloană si într-o regiune 3 x 3 O posibilă modelare ca o problemă CSP: fiecare poziŃie a tablei este reprezentată de o variabilă, iar domeniul unei variabile este un număr de la 1 la 9 Pentru fiecare linie, coloană si bloc 3 x 3 vom asocia o constrângere de tip alldifferent, care specifică că toate variabilele din constrângere trebuie să aibă valori diferite de restul variabilelor Figura 5 3: O tablă Sudoku Când există preferinŃe între soluŃii, acestea pot fi exprimate cu ajutorul unei funcŃii de cost, numită si funcŃie obiectiv Scopul problemei este de a determina o soluŃie cu costul cel mai bun sau o aproximare a acesteia Astfel de probleme se numesc probleme de optimizare a constrângerilor (constraint optimization) În general problemele de satisfacere a constrângerilor sunt din punct de vedere computaŃional intractabile (NP-hard) Tehnicile utilizate în rezolvarea unor astfel de probleme se împart în două mari categorii: căutare si inferenŃă Algoritmii de căutare traversează spaŃiul soluŃiilor parŃiale construind o instanŃiere completă care satisface toate constrângerile, sau determină inconsistenŃa problemei Din cadrul acestor tehnici fac parte schemele de backtracking Algoritmii de inferenŃă a 2 8 9 7 1 4 9 2 3 5 7 6 2 5 8 6 9 7 6 1 8 2 1 6 4 3 6 2 5 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 149 consistenŃei modifică la fiecare pas problema pentru a o face mai explicită, prin urmare mai usor de rezolvat Există algoritmi care combină cele două metode si care dau rezultate mai precise 5 2 Backtracking în satisfacerea constrângerilor Putem aplica un algoritm de backtracking pentru parcurgerea în adâncime (DFS) a arborelui de căutare Ordinea variabilelor poate fi fixată înainte sau poate fi determinată la execuŃie Algoritmul menŃine de-a lungul execuŃiei o mulŃime de variabile instanŃiate corect, adică o soluŃie parŃială pe care o extinde pas cu pas IniŃial, mulŃimea este vidă La fiecare pas se selectează următoarea variabilă din ordonare si se încearcă asignarea variabilei cu o valoare consistentă cu instanŃierea parŃială Dacă este găsită o astfel de valoare, algoritmul continuă procedeul cu următoarea variabilă În caz contrar, algoritmul se întoarce la variabila anterioară si ii asignează o altă valoare consistentă Dacă domeniul unei variabile devine vid, atunci nu există o soluŃie care să satisfacă toate constrângerile Algoritmul este descris mai jos Intrarea algoritmului este reŃeaua de constrângeri R=(X, D, C) MulŃimile Di' păstrează valori din domeniul Di care nu au fost încă examinate pentru instanŃierea parŃială curentă În cazul în care domeniile sunt mulŃimi ordonate de întregi nu mai sunt necesare aceste mulŃimi, ci doar un indicator care să specifice poziŃia până la care au fost considerate valorile procedure BACKTRACKING(R) begin i ← 1; Di' ← Di; while 1≤i≤n { Xi ← SELECTEAZĂ-VALOARE(); if Xi = null then i ← i-1; (întoarcere) else { i ← i+1; (înaintare) Di' ← Di; } } if i = 0 then return “problemă inconsistentă”; else return instanŃierile variabilelor Xi; end procedure SELECTEAZĂ-VALOARE() begin while Di' nu e vid { selectează aleator o valoare a din Di'; Di' ← Di' \{a}; if asignarea (Xi = a) este consistentă cu (a1,…,ai) then return a; } return null; end Algoritmul are complexitatea timp exponenŃială si complexitatea spaŃiu liniară Cristea, IoniŃă, Pistol – InteligenŃa Artificială 150 AcŃiunile algoritmului de căutare pot fi descrise de un arbore de căutare În Figura 5 4 este schiŃat subarborele asociat problemei de colorare a hărŃii din exemplul 5 2 pentru o asignare parŃială Figura 5 4: Subarborele de căutare pentru cazul în care nodul X1 este colorat cu rosu (R), X2 cu verde (V) si X3 cu albastru (A); nodurile întunecate nu reprezintă asignări valide Îmbunătătirile cunoscute ale algoritmului s-au focalizat pe cele două faze ale algoritmului: pasul de înaintare (schemele look-ahead) si pasul de întoarcere (schemele look-back) Dintre aceste extensii amintim: - backmarking: reduce numărul de verificări ale consistenŃei; - backjumping: îmbunătăŃeste alegerea variabilei pentru pasul de întoarcere; - forward-checking: verifică ca valoarea selectată pentru noua variabilă să fie compatibilă cu valorile variabilelor viitoare O altă direcŃie de îmbunătăŃire o constituie euristicile de ordonare a variabilelor, statice si dinamice pentru selectarea variabilei următoare Există si câteva abordări care ”învaŃă” prin înregistrarea de constrângeri adiŃionale de-a lungul căutării Exemplificăm în continuare câteva din aceste tehnici 5 2 1 Backjumping Unul din dezavantajele algoritmului backtracking este asa zisul mecanism de trashing: aceeasi situaŃie de blocaj (dead-end) poate fi întâlnită de mai ori O situaŃie de blocaj apare atunci când nu există o valoare consistentă din domeniul noii variabile cu asignarea parŃială anterioară Dacă Xi este variabila la care apare blocajul, algoritmul de backtracking se va întoarce la variabila anterioară Xi-1 Să presupunem că nu există nici o constrângere între variabilele Xi si Xi-1 si că există o nouă valoare pentru Xi-1 Acelasi blocaj va fi întâlnit până când vor fi epuizate toate valorile lui Xi-1 Pentru a reduce astfel de verificări inutile, a fost propusă o nouă schemă de backtracking numită backjumping (Gaschnig, 1979; Dechter, 1990) Acest algoritm se întoarce la variabila care cauzează blocajul Identificarea unei astfel de variabile se bazează pe noŃiunea de mulŃime conflict O instanŃiere consistentă (a1,…, ai) este o mulŃime conflict pentru variabila neinstanŃiată X (sau (a1, …, ai) este în conflict cu X) dacă nici o valoare din domeniul lui X nu este consistentă cu asignarea (a1,…, ai) Când se ajunge într-o situaŃie de blocaj, este recomandat să ne întoarcem cât mai R R V A R V R V A A R V A X1 X2 X3 X4 X5 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 151 mult posibil, fără însă a omite posibile soluŃii O variabilă este responsabilă pentru situaŃia de blocaj (culprit variable) dacă instanŃierea (a1,…, ab) este o mulŃime conflict minimală, adică indicele b este cel mai mic indice cu proprietatea b ≤ i, pentru care ab este în conflict cu Xi+1 Variabila cauză este sigură si optimală; sigură în sensul că nu poate fi extinsă la o soluŃie si optimală deoarece întorcându-ne la un nod dinaintea acesteia riscăm să pierdem soluŃii Algoritmul backjumping al lui Gaschnig este una din metodele care implementează această idee Pentru a localiza o astfel de variabilă, algoritmul utilizează următoarea tehnică de marcare: pentru fiecare variabilă Xi este reŃinut un pointer ultimi la cea mai recentă variabilă pentru care s-a testat consistenŃa cu Xi si care are o valoare în conflict cu o valoare din domeniul lui Xi Pe măsură ce este completată asignarea parŃială, se înregistrează o serie de informaŃii care vor fi utilizate pentru a determina variabila ce cauzează blocajul Dacă pentru asignarea (a1,…, ai) există o valoare consistentă atunci ultimi v-a fi egal cu i-1 Când ajungem într-o situaŃie de blocaj si asignarea (a1,…, ai) este inconsistentă cu Xi+1, algoritmul se va întoarce la variabila cauză, Xultim(i+1) procedure BACKJUMPING(R) begin i ← 1; Di' ← Di; ultimi ← 0; while 1≤i≤n { Xi ← SELECTEAZĂ-VALOARE(); if Xi = null then i ← ultimi; (întoarcere) else { i ← i+1; Di' ← Di; ultimi ← 0; } } if i = 0 then return “problemă inconsistentă”; else return instanŃierile variabilelor Xi; end procedure SELECTEAZĂ-VALOARE() begin while Di' nu e vid { selectează aleator o valoare a din Di'; Di' ← Di' \{a}; consistent ← true; k ← 1; while k ultimi then ultimi ← k; if asignarea parŃială (a1,…,ak,Xi=a) nu este consistentă then consistent ← false; else k ← k + 1; } Cristea, IoniŃă, Pistol – InteligenŃa Artificială 152 if consistent = true then return a; } return null; end Ca si la backtracking, parametrul de intrare R este reŃeaua de constrângeri Exemplul 5 4: considerăm problema de 3-colorare al cărei graf este dat în figura de mai jos MulŃimea de culori este: rosu, verde si albastru a) b) Figura 5 5: a) graful b) subarborele de căutare Mai sus avem subarborele de căutare pentru cazul în care nodul X1 este colorat cu rosu (R), X2 este colorat cu albastru (A) si X3 cu verde (V) În cazul în care nodul X4 este colorat cu rosu, pentru nodul X5 nu mai există nici o valoare consistentă cu asignarea parŃială; suntem deci într-o situaŃie de blocaj Dacă am fi aplicat algoritmul backtracking, ne-am fi întors la variabila X4 si am fi încercat a-i asigna o nouă valoare (albastru), ajungând însă în aceeasi situaŃie de blocaj Între X4 si X5 nu există nici o constrângere Algoritmul backjumping se întoarce la variabila care este cauză a blocajului, în cazul nostru variabila X3 Astfel reducem numărul de verificări inutile deoarece nu vom mai testa o porŃiune a acestui subgraf O altă variantă de backjumping este algoritmul graph-based backjumping care extrage informaŃii despre posibile mulŃimi de conflicte din graful constrâns Când apare o situaŃie de blocaj algoritmul se întoarce la cea mai recentă variabilă care este conectată cu variabila curentă în graful constrâns 5 2 2 Forward-checking În algoritmul backtracking după selectarea variabilei următoare, valoarea acesteia va fi aleasă astfel încât să fie consistentă cu instanŃierea parŃială Forwardchecking (Haralick, 1980) verifică ca această valoare să fie compatibilă cu cel puŃin o valoare din domeniul fiecărei variabile viitoare Astfel algoritmul instanŃiază variabila cu o valoare si apoi elimină valori din domeniul varibilelor viitoare care sunt în conflict cu instanŃierea curentă Dacă domeniul unei variabile viitoare devine vid, algoritmul consideră următoarea valoare posibilă pentru variabila curentă Algoritmul este descris mai jos Fie Xi variabila curentă Ca si la backjumping, mulŃimile D' conŃin domeniile reduse IniŃial acestea sunt egale cu domeniile R R A V R V R A V A V X1 X2 X3 X4 X5 R A R A V nu mai e verificat de backjumping Cristea, IoniŃă, Pistol – InteligenŃa Artificială 153 originale, si vor fi modificate în funcŃia SELECTEAZĂ-VALOARE FORWARDCHECKING() (referit ca FC, mai departe) alege variabilei curente o valoare consistentă cu variabilele viitoare procedure FORWARD-CHECKING(R) begin Di' ← Di , 1≤i≤n; i ← 1; while 1≤i≤n { selectează pentru Xi o valoare din domeniu consistentă cu cel puŃin o valoare pentru fiecare din variabilele următoare: Xi ← SELECTEAZĂ-VALOARE(); if Xi = null then { i ← i-1 resetează Dk' la valoarea dinaintea ultimei instanŃieri a lui Xi, k>i; } else i ← i+1; } if i = 0 then return “problemă inconsistentă” else return instanŃierile variabilelor Xi; end procedure SELECTEAZĂ-VALOARE() begin while Di' nu e vid { selectează aleator o valoare a din Di' ; Di' ← Di' \{a}; domeniu-vid ← false; for 1≤k≤n { for b din Dk' if asignarea (a1,…,ai-1,Xi=a,Xk=b) nu este consistentă then Dk' ← Dk' \{b}; if Dk' este vid (bolcaj) then domeniu-vid ← true; } if domeniu-vid = true then resetează Dk' la valoarea dinaintea selectării lui a, i≤k≤n; else return a; } return null; end Reluarea exemplului 5 1: considerăm problema celor 4 regine, modelată ca în Exemplul 5 1, în cazul în care am asignat variabilei X1 valoarea 4 La acest pas, algoritmul FC elimină temporar din domeniul variabilei X2 valorile 3 si 4 deoarece nu Cristea, IoniŃă, Pistol – InteligenŃa Artificială 154 sunt consistente cu asignarea parŃială (X1=4) (a) Similar pentru domeniile variabilelor X3 si X4 Cazul în care pentru variabila X2 este aleasă valoarea 1 este evidenŃiat la punctul b) – noi valori pentru varialibele X3 si X4 sunt restricŃionate Singura valoare rămasă pentru variabila X3 este 3 Alegând această valoare, domeniul variabilei X4 devine vid (blocaj) a) b) c) Figura 5 6: execuŃia pas-cu-pas a algoritmului FC pentru problema celor 4-regine; a) după asignarea variabilei X1 b) după asignarea lui X2 c) după asignarea lui X3 5 3 InferenŃa Algoritmii de inferenŃă transformă problema într-una echivalentă, mai explicită prin deducerea unor noi constrângeri care vor fi adăugate mulŃimii iniŃiale Spre exemplu, din constrângerile X=Y si Y=Z putem deduce o nouă constrângere X=Z Cele două probleme sunt echivalente, adică au acelasi set de soluŃii, însă utilizând cea de-a doua reprezentare putem evita situaŃii de blocare pe care le-am fi întâlnit în primul caz Cum problema devine mai restrictivă, spaŃiul de căutare se va micsora, în consecinŃă căutarea va fi mai eficientă 1 2 3 4 Q X1 X2 X3 X4 X X X X X X X1=4 D2 = {1,2}, D3 = {1,3}, D4 = {2,3} Q X1 X2 X3 X4 X X X X X Q X X X X1=4, X2=1 D3 = {3}, D4 = {2} Q X1 X2 X3 X4 X X X X X Q X X Q X X X1=4, X2=1, X3=3 D4 = {} Cristea, IoniŃă, Pistol – InteligenŃa Artificială 155 Un algoritm de propagare a constrângerilor garantează că orice soluŃie parŃială poate fi extinsă la o nouă variabilă astfel încât noua asignare să rămână consistentă (Mackworth, 1977) Algoritmii de i-consistenŃă în general garantează că orice instanŃiere consistentă a i-1 variabile poate fi extinsă la o instanŃiere consistentă de lungime i Cel mai cunoscut algoritm de consistenŃă este arcconsistenŃa (sau 2-consistenŃa) 5 3 1 Arc-consistenŃă O componentă principală a algoritmului de arc-consistenŃă o constituie procedura pentru verificarea consistenŃei valorilor din domeniu în raport cu o constrângere Procedura Revise() are ca intrare două variabile Xi si Xj (indicii lor) si verifică dacă pentru fiecare valoare y din Di există cel puŃin o valoare compatibilă cu ea din domeniul Dj Dacă nu există o astfel de valoare, atunci o atribuire de tipul Xi=y nu este validă Rezultă că valoarea y poate fi stearsă din domeniu procedure REVISE(i,j) begin for y în Di if nu există o valoare z în Dj a î asignarea (Xi=y,Xj=z) să fie consistentă: (y, z)ÎRij then sterge y din Di; end Complexitatea procedurii este O(k2), unde k este dimensiunea domeniului Descriem în continuare cea mai simplă variantă de arc-consistenŃă Algoritmul Arc-ConsistenŃă-1 (AC-1) aplică procedura Revise tuturor perechilor de variabile care participă într-o constrângere până când nu se mai modifică nici un domeniu procedure AC-1(R) begin repeat for perechea {Xi,Xj} care participă într-o constrângere { Revise(i,j); Revise(j,i); } until nici un domeniu nu se mai modifică end Complexitatea algoritmului AC-1 este O(enk3), unde n este numărul de variabile, domeniul este limitat superior de k, iar e numărul de constrângeri binare Exemplul 5 5 Considerăm următoarea problemă de colorare a grafului cu nodurile X1, X2, X3 Domeniile de valori ale variabilelor asociate vârfurilor grafului sunt D1={R,V,G}, D2={R,V}, D3={V} Graful constrâns este reprezentat mai jos Cristea, IoniŃă, Pistol – InteligenŃa Artificială 156 a) b) Figura 5 7: Problema colorării grafului: noduri X1, X2, X3; domeniile sunt cele din interiorul elipselor a) graful constrâns inŃial b) graful după aplicarea arc-consistenŃei La examinarea arcului dintre nodurile X1 si X2 nu se modifică domeniul nici unei variabile În cazul arcului (X1,X3) pentru culoarea verde (V) a nodului X1 nu există o culoare corespondentă diferită de aceasta pentru a satisface constrângerea Astfel valoarea verde va fi eliminată din domeniul variabilei X1 Procedeul continuă similar prin eliminarea valorii verde pentru variabila X2 la procesarea nodului (X2,X3), rezultând graful din Figura 5 7 b) Una din îmbunătăŃirile algoritmului AC-1 se sprijină pe următoarea observaŃie: chiar dacă numai un singur arc este modificat la iteraŃia curentă, AC-1 revizuieste toate arcele la iteraŃia următoare; este mult mai probabil ca un număr mic de arce să fie afectate de această modificare Algoritmul AC-3 elimină acest dezavantaj revizuind doar acele constrângeri care pot fi afectate de modificările de la iteraŃia anterioară ReŃinem într-o coadă constrângerile care trebuiesc procesate IniŃial fiecare pereche de variabile care participă într-o constrângere este pusă în coadă de două ori (pentru fiecare ordonare a perechii de variabile) La procesarea unei perechi ordonate de variabile, aceasta va fi stearsă din coadă si va fi adăugată din nou în coadă doar dacă domeniul celei de-a doua variabile este modificat în urma procesării constrângerilor adiacente procedure AC-3(R) begin Q ← Ø for perechea {Xi,Xj} care participă într-o constrângere { Q inserează(Xi,Xj); Q inserează(Xj,Xi); } while Q nu e vidă { Q sterge(Xi,Xj); Revise(i,j); if Revise(i,j) modifică Di then Q inserează(Xk,Xi), unde i≠k, dacă arcul nu există în Q; } end Exemplul 5 6: considerăm problema din Exemplul anterior 5 5 La procesarea constrângerii dintre variabilele X1 si X2 domeniile variabilelor rămân neschimbate Cristea, IoniŃă, Pistol – InteligenŃa Artificială 157 Când verificăm arcul (X1,X3) domeniul variabilei X1 se modifică Adăugăm la coadă arcul (X2,X1) (arcul (X3,X1) există deja în coadă) Procedeul este repetat până când coada devine vidă Observăm că dacă am fi utilizat AC-1 am fi verificat în plus încă 4 arce corespunzătoare constrângerilor dintre X1 si X3, respectiv X2 si X3 Tabela 5 1:execuŃia algoritmului AC-3 pentru problema de colorare din Exemplul 5 5 arc Q domenii {(X1,X2), (X2,X1), (X1,X3), (X3,X1), (X2,X3), (X3,X2)} D1={R,V,G}, D2={R,V}, D3={V} (X1,X2) {(X2,X1), (X1,X3), (X3,X1), (X2,X3), (X3,X2)} (X2,X1) {(X1,X3), (X3,X1), (X2,X3), (X3,X2)} (X1,X3) {(X3,X1), (X2,X3), (X3,X2), (X2,X1)} D1={R,G}, D2={R,V}, D3={V} (X3,X1) {(X2,X3), (X3,X2), (X2,X1)} (X2,X3) {(X3,X2), (X2,X1), (X1,X2)} D1={R,G}, D2={V}, D3={V} (X3,X2) {(X2,X1), (X1,X2)} (X2,X1) {(X1,X2)} (X1,X2) {} Complexitatea algoritmului AC-3 este O(ek3) Algoritmul de arc-consistenŃă poate fi îmbunătăŃit mai mult, ajungându-se la complexitatea minimă de O(ek2) Algoritmii care asigură consistenŃă locală sunt folosiŃi în general ca algoritmi de preprocesare, utilizaŃi înaintea căutării Backtracking-ul va fi mai eficient pe reprezentări mai explicite, deci cu un grad de consistenŃă locală mai mare Metodele folosite în practică combină de obicei inferenŃa cu căutarea, în ideea îmbunătăŃirii rezultatelor căutării Trebuie avută însă grijă la cantitatea de inferenŃă utilizată: este bine de obicei să existe un echilibru între efortul depus în propagarea constrângerilor si cel depus în căutare 5 3 2 Bucket-Elimination Deoarece algoritmii de căutare în mod uzual extind o soluŃie parŃială pas cu pas, inferenŃa poate fi restricŃionată la o ordine a variabilelor Această idee corespunde noŃiunii de consistenŃă direcŃională Bucket-elimination (Dechter, 1996) este un algoritm din această categorie, mai puŃin costisitor Algoritmul are ca intrare o mulŃime de relaŃii sau constrângeri Dată o anumită ordonare, algoritmul împarte mulŃimea de relaŃii în submulŃimi (bucket-uri) Fiecare submulŃime este asociată unei singure variabile O relaŃie va aparŃine submulŃimii corespunzătoare argumentului care apare ultimul în ordonare În prima fază a algoritmului fiecare bucket este procesat începând de la ultima variabilă către prima Procesarea variabilei X constă în aplicarea unui operator de eliminare de variabile În urma aplicării unei astfel de proceduri, rezultă o nouă funcŃie definită peste aproape toate variabilele din bucket cu excepŃia lui X Această funcŃie rezumă efectul variabilei X Ea este introdusă într-un bucket inferior În cea de-a doua fază, aloritmul construieste o soluŃie asignând o valoare fiecărei variabile Ordinea de asignare este cea considerată iniŃial În acestă etapă Cristea, IoniŃă, Pistol – InteligenŃa Artificială 158 sunt consultate relaŃiile create în cadrul primei faze Algoritmul este prezentat mai jos procedure BE-MaxCSP(R) begin 1 IniŃializare: partiŃionează relaŃiile în bucket1, ,bucketn, unde bucketi conŃine relaŃiile care au variabila cea mai îndepărtată Xi Fie S1, ,Sj scopurile relaŃiilor din bucket-ul procesat 2 Backward: for p ← n până la 1 for h1, h2, , hj din bucketp if bucketp conŃine o instanŃiere Xp=xp then { asignează variabila Xp cu valoarea xp pentru fiecare relaŃie hi ; adaugă relaŃiile rezultate în bucket-urile corespunzătoare; } else { generează funcŃia hp: Σ= = j X i i hp h p 1 min ; { } 1 p j p i i U = S − X = U ; adaugă hp la bucket-ul corespunzător variabilei cu indexul cel mai mare din Up; } 3 Forward: asignează valori variabilelor în ordinea considerată a î combinaŃia de funcŃii din fiecare bucket să fie optimizată; return asignarea optimă si funcŃia calculată în bucket-ul corespunzător primei variabile end Algoritmii de acest tip au avantajul cunoasterii a-priori a performanŃei lor, performanŃă ce poate fi mărginită de un parametru al grafului, lăŃimea indusă w* Pentru definirea acestei valori, avem nevoie de următoarele noŃiuni LăŃimea unui nod într-un graf ordonat (G, d) este egală cu numărul de părinŃi ai nodului Graful indus al unui graf ordonat (G, d) este graful reprezentat prin perechea (G*,d) unde G* este obŃinut prin procesarea nodurilor grafului iniŃial G Procesarea unui nod rezultă în conectarea părintilor acestuia LăŃimea indusă a grafului ordonat (G,d), w*(d) este egală cu lăŃimea grafului indus (G*,d) LăŃimea indusă a unui graf, w* este lăŃimea indusă minimală peste toate ordonările Cristea, IoniŃă, Pistol – InteligenŃa Artificială 159 a) b) Figura 5 8: graful indus al problemei de 3-colorare din Exemplul 5 4, construit pentru a) ordonarea d1=(X4, X2, X3, X1, X5) si b) ordonarea d2=(X5, X1, X2, X3, X4); noile arce sunt reprezentate prin linii întrerupte (X3X4) În exemplul de mai sus lăŃimea indusă a grafului indus (G*,d1) este 3 , iar în cel de-al doilea caz, pentru (G*,d2), este 2 Complexitatea timp si spaŃiu a algoritmului Bucket-Elimination este exponenŃială în lăŃimea indusă a grafului de interacŃiune a problemei pentru o ordonare dată Valoarea lăŃimii induse poate varia pentru ordonări diferite, ceea ce implică complexităŃi diferite Exemplul 5 7: considerăm aceeasi problemă de 3-colorare din Exemplul 5 4 Primii doi pasi ai algoritmului sunt evidenŃiati în Figura 5 9, pentru ordonarea d1=(X4, X2, X3, X1, X5) bucket(X5): X5≠X2, X5≠X3, X5≠X1 bucket(X5): X5≠X2, X5≠X3, X5≠X1 bucket(X1): X1≠X2, X1≠X3 bucket(X1): X1≠X2, X1≠X3 , RX1X2X3 bucket(X3): X3≠X4 bucket(X3): X3≠X4, RX2X3 bucket(X2): bucket(X2): RX2X4 bucket(X4): bucket(X4): RX4 Figura 5 9 pasul de iniŃializare si pasul Backward ai algoritmului Bucket-Elimination În partea stângă avem partiŃionarea iniŃială, iar în dreapta relaŃiile după procesare Din cele trei constrângeri din bucket-ul 5 rezultă o nouă relaŃie între variabilele rămase, X1, X2 si X3, relaŃie care este copiată în bucket-ul corespunzător variabilei X1 Această relaŃie nu mai este binară, ca relaŃiile iniŃiale, ci conŃine trei variabile Similar, din procesarea fiecărui bucket următor rezultă câte o relaŃie nouă Principalul dezavantaj al algoritmului Bucket-Elimination este complexitatea timp mare dar în special complexitatea spaŃiu datorată memorării funcŃiilor intermediare Pentru a reduce complexitatea spaŃiu se pot utiliza algoritmi de aproximare Puterea acestor algoritmi constă în limitarea dimensiunii si/sau a numărului de funcŃii înregistrate ConsistenŃa locală este un exemplu de inferenŃă Cristea, IoniŃă, Pistol – InteligenŃa Artificială 160 aproximată Mini-bucket elimination este deasemeni o schemă de aproximare care încearcă să elimine dezavantajul amintit prin partiŃionarea bucket-urilor mari în submulŃimi mai mici (mini-bucket-uri) Această metodă permite un echilibru controlat între calitatea aproximării si complexitatea calculului 5 4 Euristici pentru selectarea variabilelor si a valorilor Când încercăm să extindem o soluŃie parŃială, avem de ales următoarea variabilă si valoarea acesteia Aceste decizii sunt importante deoarece pot reduce din verificările algoritmului de căutare, evitând situaŃiile de blocaj 5 4 1 Ordonarea variabilelor Metodele pentru ordonarea variabilelor se pot împărŃi în două categorii: ordonări statice sau dinamice Aceste euristici îmbunătăŃesc pasul de alegere a variabilei următoare în algoritmul backtracking În primul caz, ordinea este specificată înaintea execuŃiei algoritmului de căutare si nu este modificată apoi Printre cele mai eficiente metode de acest tip amintim euristicile Minimum width (MW) si Maximum cardinality, euristici care utilizează informaŃii din graful constrâns MW construieste o ordine în sens invers, de la ultima către prima variabilă, după următorul criteriu: alege variabila cu cele mai puŃine conexiuni către variabilele care nu au fost încă alese Euristica Maximum cardinality selectează iniŃial o variabilă aleatoare si apoi la fiecare pas alege variabila conectată cu o mulŃime maximală de variabile deja alese În cazul unei ordonări dinamice, alegerea variabilei următoare depinde de starea curentă Ordonarea dinamică nu se poate aplica pentru toŃi algoritmii de căutare Spre exemplu, pentru backtracking nu există informaŃie suplimentară care să poată diferenŃia între variabile În cazul algoritmilor Forward-checking sau ArcconsistenŃă, starea curentă include domeniile restrânse ale variabilelor Subproblema care trebuie rezolvată de acesti algoritmi se modifică după fiecare asignare Astfel o ordonare dinamică, în care următoarea variabilă de asignat este selectată pe baza informaŃiilor despre starea curentă ar putea conduce la o performanŃă mai bună a algoritmilor O metodă des întâlnită de alegere a variabilei următoare este selectarea celei mai constrânse variabile (euristica Minimum Remaining Values MRV) Altfel spus variabila cu domeniul curent cel mai mic urmează a fi asignată la pasul următor Motivul acestei decizii se bazează pe următoarea idee: este mai eficient a elimina cât mai multe posibilităŃi cât mai devreme Variabila selectată minimizează factorul de ramificare al nodului curent, adică numărul de direcŃii posibil de explorat Exemplul 5 8: în cazul problemei de colorare din Figura 5 2, după asignările X1=R si X3=V, domeniul variabilei X5 va conŃine o singură valoare, deci ar fi mai avantajos să asignăm lui X5 culoarea albastru decât să asignăm o valoare variabilelor X2 sau X4 care au câte două valori în domeniu Există situaŃii în care dimensiunea domeniului variabilelor este aceeasi În multe probleme (de exemplu, problema reginelor) domeniile iniŃiale au aceeasi dimensiune Putem alege în acest caz variabila care constrânge cel mai mult spaŃiul Cristea, IoniŃă, Pistol – InteligenŃa Artificială 161 de căutare, adică constrânge cât mai multe variabile neasignate Justificarea e că încercăm astfel să reducem factorul de ramificare al nodurilor viitoare Pentru aceeasi problemă de 3-colorare, toate variabilele au domeniile iniŃiale egale, conŃin cele trei culori posibile Nodurile X1, X3 si X5 au gradul cel mai mare La primul pas alegem unul din aceste noduri Similar, după asignarea culorii rosu pentru variabila X1, domeniile variabilelor X2, X3 si X5 sunt egale Variabilele X3 si X5 au câte două conexiuni către nodurile încă neasignate (X2 are un singur arc) Se alege unul din aceste două noduri la pasul următor Tabelul 5 2 exemplifică pasii algoritmului Forward-checking combinat cu cele două euristici de selectare a variabilei următoare Tabela 5 2: ExecuŃia algoritmului FC pentru problema din Exemplul 5 2 X1 X2 X3 X4 X5 domeniile initiale R, A, V R, A, V R, A, V R, A, V R, A, V după X1=R R A, V A, V R, A, V A, V după X3=V R A, V V R, A A după X5=A R V V R, A A după X2=V R V V R, A A după X4=R R V V R A Această combinaŃie a fost propusă iniŃial pentru problema colorării grafurilor (euristica lui Brelaz) Se alege drept nod următor vârful cu cele mai puŃine culori disponibile, iar în caz de egalitate - vârful adiacent cu cel mai mare număr de noduri necolorate Această euristică furnizează rezultate bune pentru problema colorării Domeniile au iniŃial aceeasi dimensiune si constrângerile sunt similare Euristica explorează întâi zonele cele mai dense ale grafului Astfel sunt sanse mai mari să detectăm, încă de la începutul căutării, o clică cu un număr de noduri mai mare decât numărul de culori disponibile si să oprim căutarea, pe motiv că problema e inconsistentă Pentru probleme CSP generale, în care aceste condiŃii nu au loc, există metode care dau rezultate mai bune De exemplu, dacă unele constrângeri sunt mai dificil de satisfăcut decât altele, atunci ar fi de preferat să asignăm valori variabilelor implicate în aceste constrângeri mai întâi, indiferent de dimensiunea domeniului 5 4 2 Selectarea valorilor Algoritmul de căutare trebuie să aibă definită o ordine în care vor fi asignate valorile variabilelor O ordonare bună a valorilor poate avantaja procesul de căutare O direcŃie care conduce la o soluŃie este verificată mai devreme decât cele care conduc la situaŃii de blocaj Această situaŃie este valabilă pentru cazul în care se doreste determinarea unei soluŃii În cazul în care dorim să identificăm toate soluŃiile problemei, sau în caz de inconsistenŃă, această ordine nu contează atât de mult În majoritatea cazurilor, se alege valoarea cea mai puŃin constrânsă, care maximizează deci opŃiunile viitoare de instanŃiere Cristea, IoniŃă, Pistol – InteligenŃa Artificială 162 Pe baza principiului de mai sus s-au mai propus si alte câteva metode pentru selectarea valorii variabilei curente Se verifică pentru fiecare valoare în parte domeniile variabilelor viitoare (similar procedurii Forward-checking) Se alege valoarea cu costul cel mai mic, unde costul este dat de procentul de valori din domeniile viitoare care nu vor mai putea fi utilizate O altă variantă propusă constă în selectarea celei mai “promiŃătoare” valori, adică cu cea mai mare valoare pentru produsul dimensiunii domeniilor variabilelor viitoare Aceste variante sunt din păcate destul de costisitoare În general, beneficiul alegerii unei valori care are o probabilitate mai mare de a conduce către o soluŃie nu este contrabalansat de efortul depus în Forward-checking pentru fiecare valoare În cazuri particulare, există informaŃie suplimentară care poate fi utilizată pentru selectarea unei astfel de valori O descriere a tehnicilor generale de rezolvare a problemelor de satisfacere a constrângerilor poate fi consultată si în tutorialul on-line al lui Bartak (vezi Bartak, R în referinŃe) 5 5 Metode stochastice Deoarece majoritatea problemelor din lumea reală sunt supra-constrânse si nu au o soluŃie exactă, este preferat un algoritm de căutare stochastică pentru o rezolvare mai rapidă a problemei Abordări bazate pe metaeuristici si paradigme inspirate din natură s-au dovedit a fi eficiente în domeniul inteligenŃei artificiale aplicate si cel al optimizării combinatorii Au fost încercate si pentru problemele de satisfacere a constrângerilor metode de căutare locală, ca euristicile min-conflicts, stochastic local search, sau metaeuristici precum algoritmii genetici (Craenen, 2003) Algoritmii de căutare locală pornesc cu o asignare completă, si la fiecare pas, încearcă să o îmbunătăŃească prin modificarea valorii unei variabile Asignarea iniŃială este generată aleator sau utilizând o metodă deterministă FuncŃia de evaluare a unei astfel de soluŃii poate fi, în cazul problemelor CSP, numărul de constrângeri violate Variabila a cărei valoare va fi modificată, respectiv noua valoare în cel mai simplu caz, sunt alese aleator De exemplu, pentru problema reginelor, starea iniŃială este o configuraŃie aleatoare a reginelor pe coloane Un pas al algoritmului ar consta în alegerea unei regine si mutarea acesteia pe o altă poziŃie în cadrul coloanei respective Euristica min-conflicts selectează valoarea care minimizează numărul de conflicte Metoda s-a dovedit a fi eficientă pentru problema reginelor: găseste soluŃia după un număr mic de iteraŃii Rezultate bune s-au obŃinut si pentru probleme de planificare În cazul în care problema nu are soluŃie, algoritmii stochastici nu pot detecta acest lucru Avantajul utilizarii lor îl constituie faptul că pot determina un optim local destul de bun pentru problemele în care algoritmii deterministi nu sunt fezabili 5 6 Concluzii În acest capitol am prezentat o descriere sumară a problemelor de satisfacere a constrângerilor Multe probleme din lumea reală pot fi modelate ca probleme CSP Printre tehnicile de rezolvare a acestora se numară scheme de Cristea, IoniŃă, Pistol – InteligenŃa Artificială 163 backtracking inteligent si inferenŃa Euristicile de ordonare a variabilelor si a valorilor îmbunătăŃesc căutarea CerinŃe pentru studenŃi • să recunoască care probleme pot fi modelate ca probleme CSP - să identifice metoda cea mai potrivită pentru o problemă CSP Probleme P5 1 FormulaŃi următoarele probleme ca probleme de satisfacere a constrângerilor: • Problema planificării unei suprafeŃe dreptunghiulare (rectilinear floor-planning): dată o mulŃime de dreptunghiuri mici, să se amplaseze aceste dreptunghiuri pe o suprafaŃa dreptunghiulară mai mare astfel încât acestea să nu se suprapună • Pătratul magic: să se aranjeze cifre de la 1 la 9 într-un pătrat de 3x3 astfel încât suma celor 3 numere din fiecare linie, coloană si diagonală să fie aceeasi • Problema planificării examenelor: să se planifice examenele unei mulŃimi de studenŃi Pentru fiecare student se cunosc obiectele la care acesta are de susŃinut o probă Posibilele perioade de timp sunt stabilite apriori CondiŃia principală este ca examenele unui student sa fie programate în perioade diferite P5 2 ModelaŃi problema de mai jos ca o problemă CSP: Cinci copii sunt în spital si fiecare este vizitat în perioada stabilită pentru vizite de un prieten sau o rudă Acesta ii aduce două cadouri: ceva de mâncare sau de băut si o jucărie Problema este de a identifica pentru fiecare copil care este vizitatorul său si cadourile pe care le-a primit, având date următoarele informaŃii: Cei cinci copii: Maria, Ana, Petru, Stefan, Ioana; Vizitatorii: matusa, tata, prietenul, bunicul, mama; Cadouri: banane, prajitură, jeleuri, suc de portocale, caramele; carte de colorat, minge, papusă, cărŃi de joc, carte de povesti Mai stim în plus: Copilul care a primit păpusa nu a primit dulciuri Bananele si cărŃile de joc au fost date aceleeasi fetiŃe Persoana care a cumpărat sucul de portocale nu a fost o rudă de sex feminin Prietenul lui Stefan i-a adus mingea Papusa a fost dăruită unei fetiŃe Prajitura a fost pentru ziua Mariei Caramelele au fost date unui băiat Vizitatorul Ioanei nu a fost o rudă de sex feminin Bunicul Anei i-a adus dulciurile ei preferate Vizitatorul lui Petru a fost mătusa lui; el nu a primit cartea de colorat AplicaŃi algoritmul Arc-consistenŃa pentru această problemă P5 3 Fie urmatoarea problemă de satisfacere a constrângerilor, dată prin graful constrâns din Figura 5 10 Domeniile variabilelor sunt: D1={P, K, B}, D2={U, L, I}, D3={V, U, N}, D4={K, J, E, B} Constrângerile exprimă ordinea lexicografică între variabilele implicate în relaŃie DescrieŃi pasii algoritmului Backjumping pentru această problemă Cristea, IoniŃă, Pistol – InteligenŃa Artificială 164 Figura 5 10: graful constrâns P5 4 ConsideraŃi problema 8-regine ExemplificaŃi printr-o situaŃie utilitatea algoritmului Backjumping relativ la Backtracking P5 5 ModelaŃi problema reprezentată de puzzle-ul de mai jos ca o problemă CSP PropuneŃi cel puŃin două variante de modelare RezolvaŃi problema utilizând metoda Forward-checking combinată cu euristica MRV de selectare a variabilei si euristica care selectează valoarea cea mai puŃin constrânsă DescrieŃi pas cu pas execuŃia algoritmului SATURN +URANUS =PLANETS P5 6 Fie următoarele opt pătrate poziŃionate ca în Figura 5 11: Figura 5 11: pătratele neetichetate iniŃial Problema constă în etichetarea pătratelor cu numere de la 1 la 8 astfel încât etichetele oricărei perechi de pătrate adiacente (orizontale, vericale sau diagonale) să difere prin cel puŃin 2 • ScrieŃi constrângerile sub formă de relaŃii si desenaŃi graful constrâns • Este reŃeaua arc-consistentă? Daca nu, aduceŃi-o la o formă arc-consistentă • Este reŃeua consistentă? Daca da, daŃi exemplu de o soluŃie P5 7 UtilizaŃi metoda de căutare locală min-conflicts pentru a rezolva problema celor 4 regine IniŃial consideraŃi reginele pe diagonala principală Bibliografie Dechter, R (2003) Constraint Processing Morgan Kaufmann Publishers X1 X3 X2 X4 Cristea, IoniŃă, Pistol – InteligenŃa Artificială 165 Tsang, E P K (1993) Foundations of Constraint Satisfaction, Academic Press Dechter, R (1990) Enhancement Schemes for Constraint Processing: Backjumping, Learning, and Cut-set Decomposition Artificial Intelligence, 41: 273-312 Gaschnig, J (1979) Performance Measurement and Analysis of Certain Search Algorithms Technical Report CMU-CS-79-124, Carnegie Mellon University Haralick, M , Elliot, G L (1980) Increasing tree-search efficiency for constraint satisfaction problems Artificial Intelligence, 14: 263–313 Mackworth, A K (1977) Consistency in networks of relations Artificial Intelligence, 8(1): 99 – 118 Dechter, R (1996) Bucket elimination: A unifying framework for probabilistic inference algorithms Uncertainty in Artificial Intelligence (UAI-96), pages 211–219 Craenen, B G W , Eiben, A E , van Hemert, J I (2003) Comparing Evolutionary Algorithms on Binary Constraint Satisfaction Problems IEEE Transactions on Evolutionary Computation, 7(5) : 424-444 Bartak, R On-line guide to Constraint Programming http://kti ms mff cuni cz/~bartak/constraints/index html Cristea, IoniŃă, Pistol – InteligenŃa Artificială 166 Capitolul 6 ÎnvăŃarea automată ÎnălŃimea unui munte nu este măsurată calculând efortul necesar pentru a ajunge în vârf Friedrich Nietzsche 6 1 Descriere generală ÎnvăŃarea automată, unul din sub-domeniile de bază ale InteligenŃei Artificiale, se preocupă cu dezvoltarea de algoritmi si metode ce permit unui sistem informatic să înveŃe date, reguli, chiar algoritmi ÎnvăŃarea automată presupune în primul rând identificarea si implementarea unei modalităŃi cât mai eficiente de a reprezenta informaŃii, în sensul facilitării căutării, re-organizării si modificării lor Alegerea modului de a reprezenta aceste date Ńine atât de concepŃia generală asupra modului de rezolvare a problemei, cât si de caracteristicile datelor cu care se lucrează ÎnvăŃarea nu se poate face pe baza unui set foarte mare de cunostinŃe, atât din cauza costurilor mari presupuse de acumularea unor baze de informaŃii mari cât si din cauza complexităŃii memorării si prelucrării unui volum mare de informaŃii În acelasi timp însă, învăŃarea trebuie să ducă la formularea de suficiente “reguli” atât cât să permită rezolvarea unor probleme dintr-un spaŃiu mai larg decât cel pe baza căruia s-a făcut învăŃarea Adică învăŃarea trebuie să îmbunătăŃească performanŃa unui sistem nu doar în rezolvarea repetată a unui acelasi set de probleme, ci si în rezolvarea unor probleme noi Acest lucru presupune o generalizare a unei metode de rezolvare pentru a acoperi un număr cât mai mare de instanŃe posibile, dar si păstrarea unei specializări suficiente pentru a fi identificate corect instanŃele acceptate Aceasta se poate face fie inductiv, generalizând o problemă plecând de la un set de exemple, fie deductiv, plecând de la o bază de cunostinŃe suficiente asupra universului problemei si extrăgând date si reguli esenŃiale Pentru a putea face acest lucru, un algoritm de învăŃare trebuie să fie capabil să selecteze acele elemente semnificative pentru rezolvarea unei instanŃe viitoare a problemei Aceasta alegere se face pe baza unor criterii de selecŃie numite diagonale inductive O altă componentă esenŃială al unui algoritm de învăŃare este metoda de verificare, o metodă capabilă să confirme dacă generalizările făcute sau regulile deduse se apropie mai mult de soluŃia ideală decât starea anterioară a sistemului O prezentare mai detaliată a componentelor esenŃiale ale unui sistem capabil de învăŃare este făcută în secŃiunea a doua a acestui capitol Studiul învăŃării automate a dus la descrierea a numeroase metode, variind după scop, date de antrenament, strategia de învăŃare si modalitatea de reprezentare a datelor SecŃiunea a treia face o prezentare a principalelor direcŃii în învăŃarea supervizată, ce foloseste un set de instanŃe rezolvate ale problemei pentru a antrena sistemul în vederea rezolvării unor instanŃe noi SecŃiunea a patra prezintă Cristea, IoniŃă, Pistol – InteligenŃa Artificială 167 învăŃarea prin încurajare, ce implementează o metodă de a “răsplăti” sistemul în funcŃie de progresul făcut în găsirea unei soluŃii optime Algoritmii genetici, prezentaŃi în secŃiunea a cincea, folosesc metode de reprezentare si căutare similare mecanismelor biologice SecŃiunea a sasea prezintă învăŃarea bazată pe cunostinŃe, ce deduce soluŃii pe baza unor cunostinŃe anterioare asupra domeniului problemei SecŃiunea a saptea face o prezentare a dezavantajelor conceptului de învăŃare supervizată, iar apoi în secŃiunea a opta se descrie învăŃarea nesupervizată si problema clasificării 6 2 Caracteristici ale unui sistem capabil de învăŃare Specificarea unei metode de învăŃare automată presupune definirea următoarelor date: - scopul metodei si baza de cunostinŃe necesară; - formalismul de reprezentare a datelor utilizate si a celor învăŃate; - un set de operaŃii asupra datelor disponibile si învăŃate; - un spaŃiu general al problemei în care se va specifica soluŃia; - opŃional, reguli euristice pentru căutarea în spaŃiul problemei 6 2 1 Scopul metodei si baza de cunostinŃe necesară O metodă de învăŃare este definită în primul rând de datele de plecare si scopul algoritmului, adică ce se doreste să se obŃină pe baza acestor date Plecând de la aceste caracteristici, avem următoarele variante: - datele de plecare sunt un set de exemple pozitive si negative de instanŃe ale problemei, algoritmul trebuind să găsească o generalizare care să includă instanŃele pozitive si să le excludă pe cele negative; - datele de plecare constau într-un set redus de exemple pozitive, iar algoritmul, plecând cu o bază de cunostinŃe generale asupra domeniului problemei, trebuie să facă o generalizare; - datele de plecare sunt un set de instanŃe neclasificate, algoritmul trebuind să identifice clase de instanŃe cu proprietăŃi similare; - date de plecare sub forma uneia sau a mai multor instanŃe ce descriu situaŃii ca fiind analogii ale problemei de rezolvat, algoritmul trebuind să identifice elementele ce formează analogia si să deducă soluŃia problemei Datele din baza de cunostinŃe mai sunt caracterizate si de acurateŃea si calitatea lor Cel ce învaŃă trebuie să Ńină cont de încrederea în sursa de informaŃii si de detalierea si gradul de organizare a informaŃiilor Anumite date ce ar putea contribui semnificativ la acurateŃea unei metode de învăŃare, dacă ar fi prezente în baza de cunostinŃe, pot fi prea greu de obŃinut Raportul preŃ / câstig de informaŃie trebuie avut în vedere atât în crearea bazei de cunostinŃe cât si în descrierea metodelor de învăŃare 6 2 2 Formalismul de reprezentare a datelor utilizate si a celor învăŃate Conceptele si instanŃele problemei utilizate în algoritmul de învăŃare trebuiesc formalizate ca expresii sau obiecte cu proprietăŃi cuantificabile si clar definite Reprezentarea acestor proprietăŃi se face în general într-o formă structurată, cum ar fi un tabel sau un graf Cristea, IoniŃă, Pistol – InteligenŃa Artificială 168 Un exemplu de descriere a unor instanŃe folosind logica propoziŃională este: mărime(obj1,mică) ٨ culoare(obj1,rosie) ٨ forma(obj1,rotundă) mărime(obj2,mare) ٨ culoare(obj2,rosie) ٨ forma(obj2,rotundă) iar descrierea unui concept general pentru instanŃe de tipul celor de mai sus ar fi: mărime(x,y) ٨ culoare(x,z) ٨ forma(x,rotundă) 6 2 3 Setul de operaŃii Algoritmul trebuie să aibă la dispoziŃie unelte care să îi permită manipularea datelor în reprezentarea specifică OperaŃiile necesare sunt în general cele de generalizare si specializare a unui concept, de modificare si adăugare de instanŃe si expresii, de căutare în spaŃiul problemei Operatorii de generalizare si specializare sunt esenŃiali în orice algoritm de învăŃare Tipurile principale de generalizări folosite sunt: - înlocuirea constantelor cu variabile; Exemplu: culoare(obj1,rosie) se generalizează culoare(x,rosie) ٧ culoare(x,y) - renunŃarea la condiŃii dintr-o conjuncŃie; Exemplu: mărime(obj1,mică) ٨ culoare(obj1,rosie) ٨ forma(obj1,rotundă) se generalizează culoare(obj1,rosie) ٨ forma(obj1,rotundă) - adăugarea unei disjuncŃii la o expresie; Exemplu: mărime(obj1,mică) ٨ culoare(obj1,rosie) ٨ forma(obj1,rotundă) se generalizează mărime(obj1,mică) ٨ culoare(obj1,rosie) ٨ forma(obj1,rotundă) ٧ mărime(obj1,mare) - înlocuirea unei proprietăŃi cu o descriere mai generală; Exemplu: culoare(obj1,rosie) se generalizează culoare(obj1,culoare de bază) Mărimea setului de operaŃii disponibile si complexitatea lor sunt lucruri care au în general un impact puternic asupra rezultatelor obŃinute prin învăŃare, asupra vitezei învăŃării De asemenea, operaŃiile disponibile restrâng soluŃiile posibile la cele care pot fi obŃinute si exprimate prin aceste operaŃii, deci definirea lor trebuie să fie considerată una din cele mai importante etape, atât în descrierea algoritmilor de învăŃare cât si în formularea problemelor pentru sistemele de învăŃare automată Cristea, IoniŃă, Pistol – InteligenŃa Artificială 169 6 2 4 SpaŃiul general al problemei Limbajul de reprezentare si setul de operaŃii descriu un spaŃiu de definiŃie a conceptului problemei ÎnvăŃarea constă în “navigarea” prin acest spaŃiu în scopul ajungerii la un concept-Ńintă sau la noi cunostinŃe Dificultatea rezolvării problemei este direct proporŃională cu complexitatea acestui spaŃiu general al problemei Evident, dimensiunea sa este strâns legată de formalismul de reprezentare ales si de operaŃiile descrise pentru aceste reprezentări, lucruri ce sunt făcute odată cu descrierea metodei de învăŃare si formularea problemei Aceasta înseamnă că putem descrie o metodă de învăŃare rapidă, pe un spaŃiu mic de soluŃii, dar formalismul de reprezentare si operaŃiile nu vor avea o putere expresivă mare Trebuie avut în vedere echilibrul între puterea descriptivă si timpul de găsire a unei soluŃii De asemenea, de aici rezultă si faptul că o metodă de învăŃare concepută pentru o problemă specifică se va comporta de obicei mai bine decât o metodă generală de învăŃare 6 2 5 Reguli euristice pentru căutare Ordinea si modalitatea prin care se face căutarea în spaŃiul de soluŃii al problemei sunt, în general, stabilite printr-un set de reguli euristice Aceste reguli direcŃionează algoritmul si îl ajută să ia decizii în privinŃa momentului si felului în care se poate generaliza sau specializa un concept, sau se poate introduce un concept nou Aceste euristici sunt în general descrise odată cu algoritmul propriuzis, fiind proprii fiecărei metode de învăŃare Aceste reguli pot lipsi, ele nefiind în general esenŃiale funcŃionării algoritmului, ci având doar rolul de a optimiza funcŃionarea sa 6 3 ÎnvăŃarea supervizată ÎnvăŃarea supervizată este un tip de învăŃare inductivă ce pleacă de la un set de exemple de instanŃe ale problemei si formează o funcŃie de evaluare (sablon) care să permită clasificarea (rezolvarea) unor instanŃe noi ÎnvăŃarea este supervizată în sensul că setul de exemple este dat împreună cu clasificarea lor corectă Aceste instanŃe rezolvate se numesc instanŃe de antrenament Formal, setul de instanŃe de antrenament este o mulŃime de perechi atribut-valoare (x,f(x)), unde x este instanŃa iar f(x) clasa căreia îi aparŃine instanŃa respectivă De exemplu, un set de instanŃe de antrenament ar putea fi: I1: (culoare(obj1,rosie) ٨ forma(obj1,rotundă), f(obj1)=”sferă”) I2: (mărime(obj2,mare) ٨ forma(obj2,cubică), f(obj2)=”cub”) Scopul învăŃării este construirea unei funcŃii-sablon care să clasifice corect instanŃele-exemplu, iar pentru un x pentru care nu se cunoaste f(x) să propună o aproximare cât mai corectă a valorii f(x) 6 3 1 Concepte invăŃabile PAC Teoria ÎnvăŃării ComputaŃionale propune o baza teoretică pentru sistemele capabile de învăŃare Problema principală care se pune este: cum demonstrăm faptul ca un sablon se apropie de perfecŃiune în etichetarea oricăror instanŃe noi? Cristea, IoniŃă, Pistol – InteligenŃa Artificială 170 Fie f funcŃia pe care dorim să o aproximăm, S un set de instanŃe de antrenament (x,f(x)) , iar h funcŃia indusă prin învăŃare Este sau nu h(x) aproape de f(x), pentru orice x din spaŃiul instanŃelor posibile? Argumentul standard este acela că h nu poate fi prea departe de f, căci h clasifică corect instanŃele de antrenament, deci probabil si pe celelalte Deci h este probabil aproximativ corect (PAC) Un concept este învăŃabil PAC dacă există un algoritm eficient care are o probabilitate mare de a găsi o aproximare a conceptului probabil aproximativ corectă Termenul “invăŃabil PAC” a fost introdus de Valiant (1984) Presupunerea aflată la baza acestei justificări este aceea că instanŃele de antrenament si instanŃele de testare sunt uniform distribuite în spaŃiul instanŃelor posibile ale problemei Acest lucru este fundamental în justificarea oricărui rezultat al unei învăŃării supervizate Pentru calculul devierii unei funcŃii-sablon h faŃa de f, putem defini o funcŃie de eroare E(h) ca fiind: E(h) = Pr(h(x) != f(x) | x din D) unde D este o mulŃime de instanŃe uniform distribuite în spaŃiul instanŃelor posibile Sablonul h este numit aproximativ corect dacă E(h) minge(X) mic(X) => usor(X) fără colŃuri(X) => rotund(X) Din această bază de cunostinŃe si din instanŃa de antrenament: culoare(obj,rosu) ٨ mic(obj) ٨ rotund (obj) => minge(obj) dorim să obŃinem un sablon pentru a identifica obiecte cu proprietatea minge(obj) Un algoritm de învăŃare bazat pe explicaŃii va găsi justificarea instanŃei pe baza cunostinŃelor, si anume: mic(obj) => usor(obj) usor(obj) ٨ rotund(obj) => minge(obj) rotund (obj) Prin generalizare, va fi format sablonul: mic(X) ٨ rotund(X) => minge(X) Forma generală a algoritmului de învăŃare bazată pe explicaŃii, când P este premiza, C – concluzia unei reguli din baza de cunostinŃe, iar S – sablonul curent propus, este: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 182 EBL(P,C,S) begin Ts = cel mai general unificator al PxS si CxS; S = SxTs; Tg = cel mai general unificator al PxG si CxG; G = GxTg; if (P si C sunt compatibile cu o instanŃă de antrenament) begin Ts = cel mai general unificator al PxS si CxS; S = SxTs; end; end G reprezintă lista substituŃiilor de generalizare (înlocuire a unei constante cu o variabilă în premiza unei reguli) 6 3 14 ÎnvăŃarea bazată pe relevanŃă ÎnvăŃarea bazată pe relevanŃă este o formă de învăŃare automată bazată pe o baza de cunostinŃe ce conŃine informaŃii privind relevanŃa unor anumite proprietăŃi ale unei instanŃe, relativ la apartenenŃa sa la conceptul Ńintă De exemplu, proprietatea unui obiect de a fi rotund are o relevanŃă mare în privinŃa apartenenŃei sale la conceptul minge, în schimb proprietatea sa de a avea culoarea rosie este irelevantă Aceasta metodă presupune ca baza de cunostinŃe să conŃină dependenŃe funcŃionale care să contribuie la definirea conceptului Algoritmul de învăŃare va încerca, pe această bază, să găsească implicaŃii consistente cu proprietăŃile cunoscute ale instanŃelor de antrenament 6 3 15 ÎnvăŃarea inductivă bazată pe cunostinŃe ÎnvăŃarea inductivă bazată pe cunostinŃe foloseste regulile cunoscute si instanŃele de antrenament pentru a încerca să formeze reguli noi care să explice proprietăŃile care nu sunt justificabile pe baza cunostinŃelor anterioare De exemplu, pentru baza de cunostinŃe: rotund(X) ٨ usor(X) ٨ sare(X) => minge(X) mic(X) => usor(X) si instanŃele: rotund(obj1) ٨ mic(obj1) ٨ elastic (obj1) ٨ sare (obj1) => minge(obj1) rotund(obj2) ٨ usor(obj2) ٨ elastic (obj2) ٨ sare (obj2) => minge(obj2) mic(obj3) ٨ sare (obj3) => nu minge(obj3) un algoritm de învăŃare inductivă ar observa concordanŃa între proprietăŃile unui obiect usor, elastic si care sare Regula obŃinută ar fi: usor(X) ٨ elastic (X) => sare(X) Cristea, IoniŃă, Pistol – InteligenŃa Artificială 183 Principalele variante ale învăŃării inductive bazate pe explicaŃii sunt rezoluŃia inversă si învăŃarea top-down RezoluŃia inversă se bazează pe faptul că dacă un concept poate clasifica o instanŃă doar pe baza setului de cunostinŃe atunci această clasificare se poate demonstra printr-o rezoluŃie Scopul este de a inversa rezoluŃia pentru a afla ipotezele iniŃiale de la care a plecat Astfel, pentru un rezolvent C sunt obŃinute două clauze C1 si C2 din care, pe baza regulilor cunoscute, se poate obŃine C Clauzele finale obŃinute astfel devin premisele unei reguli a cărei concluzie este C ÎnvăŃarea top-down este o generalizare a arborilor de decizie pentru a acoperi logica clasică Ideea este de a pleca cu o regulă foarte generală, care va fi specializată pentru a acoperi doar datele cunoscute ProprietăŃile unei instanŃe sunt reprezentate ca literali, iar sablonul este un set de clauze ce simulează un arbore de decizie Plecând de la un concept-Ńintă si un set de instanŃe de antrenament, un algoritm de învăŃare top-down construieste o clauză Horn, iniŃial vidă, care clasifică o instanŃă în conceptul Ńintă La această clauză se adaugă treptat literalii care vor îmbunătăŃi cel mai mult acurateŃea clasificărilor Algoritmul continuă până la obŃinerea unei clauze care este satisfăcută de o parte a instanŃelor pozitive de antrenament si de nici o instanŃă negativă de antrenament Clauza apoi este generalizată pentru a acoperi toate instanŃele pozitive de antrenament Alegerea literalilor ce urmează să fie adăugaŃi se face pe baza unor reguli euristice 6 3 16 Dezavantajele învăŃării supervizate Toate metodele de învăŃare prezentate în secŃiunile precedente presupun existenŃa unui set de instanŃe de antrenament despre care stim dacă aparŃin sau nu unui concept Ńintă Ele sunt folosite pentru a verifica si direcŃiona modificarea sablonului învăŃat de algoritm Necesitatea existenŃei acestor instanŃe este punctul slab al învăŃării supervizate, căci ele introduc o serie de probleme, cum ar fi: Problema limbajului de reprezentare: trebuie găsită o modalitate de a reprezenta instanŃele si conceptul-Ńintă într-o formă care să permită verificarea, generalizarea si specializarea unor sabloane Un limbaj simplu de reprezentare poate fi găsit relativ usor pentru orice domeniu, dar el poate duce la spaŃii foarte mari de căutare a conceptului-Ńintă InconsistenŃa datelor: instanŃele de antrenament si eventualele cunostinŃe anterioare ale sistemul pot fi inconsistente cu existenŃa unui concept Ńintă Erorile pot proveni atât din clasificarea instanŃelor cât si din incapacitatea limbajului de reprezentare ales de a descrie conceptul Ńintă Descrierea conceptului Ńintă: un algoritm de învăŃare poate să nu găsească nici un sablon corespunzător conceptului Ńintă sau poate să găsească mai multe sabloane corespunzătoare În cazul în care se identifică mai multor sabloane posibile, este probabil ca ele să fie inconsistente între ele, deci insuficient de generale Cristea, IoniŃă, Pistol – InteligenŃa Artificială 184 6 4 ÎnvăŃarea nesupervizată ÎnvăŃarea nesupervizată elimină complet necesitatea unor instanŃe de antrenament, deci si problemele legate de acestea Scopul învăŃării nesupervizate nu este definit anterior ca un concept Ńintă, algoritmul fiind lăsat singur să identifice concepte posibile În general, învăŃarea nesupervizată presupune existenŃa unor instanŃe neclasificate, un set de reguli euristice pentru crearea de noi instanŃe si evaluarea unor concepte deduse, eventual un model general al spaŃiului de cunostinŃe în care se găsesc aceste instanŃe Un algoritm de învăŃare nesupervizată construieste concepte pentru a clasifica instanŃele, le evaluează si le dezvoltă pe cele considerate “interesante” de regulile euristice În general, concepte interesante sunt considerate cele care acoperă o parte din instanŃe, dar nu pe toate ÎnvăŃarea nesupervizată permite identificarea unor concepte complet noi plecând de la date cunoscute Încercări de a aplica acest tip de învăŃare în cercetarea stiinŃifică au dus la rezultate semnificative Astfel AM (Davis si Lenat, 1982) pleca de la un set de concepte de bază din teoria mulŃimilor, un set de operaŃii de creare a noi concepte prin modificarea si combinarea celor existente, si un set de reguli euristice pentru a alege conceptele interesante Algoritmul a descoperit numerele naturale, conceptul de număr prim, precum si o serie de alte concepte din teoria numerelor BACON (Langley, 1987) a fost o încercare de a dezvolta un model computaŃional de dezvoltare a unor legi cantitative stiinŃifice noi Folosind date privind relaŃia între distanŃele dintre planete si soare si perioada lor de revoluŃie, BACON a re-descoperit legile lui Kepler privind miscarea planetelor Totusi aceste încercări s-au dovedit limitate în rezultate Principalul factor ce limitează numărul si relevanŃa conceptelor învăŃate de acest gen de algoritmi este faptul că ele nu pot învăŃa noi metode de a crea si evalua concepte Pentru a obŃine rezultate mai relevante, ar trebui întâi descris un set mult mai complex de operaŃii pentru crearea de noi concepte, precum si niste reguli euristice mai flexibile pentru evalua aceste concepte 6 4 1 Identificarea claselor de instanŃe Un domeniu în care învăŃarea nesupervizată si-a dovedit utilitatea este cel al identificării automate de clase în mulŃimi neclasificate de instanŃe Această problemă presupune existenŃa unei mulŃimi de obiecte negrupate si a unor mijloace de a găsi si măsura similarităŃi între aceste obiecte Scopul unui algoritm de identificare a unor clase de obiecte este de a grupa obiectele într-o ierarhie de clase după criterii cum ar fi maximizarea similarităŃii obiectelor din aceeasi clasă Ierarhia de clase este reprezentată de obicei ca un arbore, fii unui nod reprezentând categorii distincte dar incluse în categoria părinte În privinŃa învăŃării automate aplicate la identificarea claselor de instanŃe există două abordări principale: taxonomia numerică si gruparea conceptuală Taxonomia numerică se bazează pe reprezentarea unui obiect ca o colecŃie de atribute cuantificabile Dacă reprezentăm un obiect ca un vector numeric de proprietăŃi, atunci similaritatea dintre două obiecte cu n proprietăŃi reprezintă distanŃa dintre reprezentările vectorilor respectivi în spaŃiul n-dimensional Un algoritm de clasificare bazată pe taxonomia numerică pentru mulŃimea de obiecte O are forma: Cristea, IoniŃă, Pistol – InteligenŃa Artificială 185 CalsificareTaxonomica(O) begin do{ selectează din O perechea (X,Y) de obiecte cu cel mai mare grad de similaritate; elimină X si Y din O; formează o clasă nouă definită de f(X,Y), unde f este de obicei funcŃia medie aritmetică; while (există un obiect din O pentru care gradul de similaritate cu clasa nou definită este mai mare de un prag S) begin adaugă obiectul la clasă; elimină obiectul din O; end; }while (O nu este mulŃime vidă) end Algoritmul poate fi extins si la obiecte reprezentate ca seturi de simboluri si nu vectori numerici Singurul obstacol este găsirea unei metode de a măsura similarităŃile dintre obiecte O soluŃie simplă este de a calcula gradul de similaritate ca fiind proporŃia dintre numărul de proprietăŃi comune si numărul total de proprietăŃi Cu cât această proporŃie va fi mai aproape de 1, cu atât obiectele respective vor avea sansa mai mare de a aparŃine aceleiasi clase Dezavantajul acestei metode de clasificare stă în faptul că nu Ńine cont de rolul semantic al proprietăŃilor obiectelor De exemplu, pentru obiectele: obiect1 = (rotund, rosu, mic) obiect2 = (pătrat, rosu, mic) obiect3 = (rotund, verde, mare) va fi găsit un grad de similaritate mai mare între obiect1 si obiect2 decât între obiect1 si obiect3, desi proprietatea mai relevantă ar trebui să fie rotund si nu rosu si mic Această metodă formează deci clase prin aprecieri subiective asupra apropierii dintre obiecte, si nu foloseste nici un mecanism de a diferenŃia proprietăŃile în funcŃie de relevanŃa lor în clasificare Un alt dezavantaj constă în faptul că această metodă de clasificare nu construieste definiŃia conceptelor pe baza cărora clasifică obiectele Clasele sunt reprezentate extensional (ca o enumerare de obiecte) si nu intensional, ca un sablon de recunoastere a obiectelor fiecărei clase Gruparea conceptuală rezolvă această problemă prin folosirea unor metode de învăŃare automată pentru a defini concepte plecând de la o bază de cunostinŃe asupra domeniului clasificării Forma generală a unui algoritm de învăŃare pentru clasificarea conceptuală, asa cum a fost descris în CLUSTER/2 (Michalski si Stepp, 1983), este: ClasificareConceptuala(O) begin Cristea, IoniŃă, Pistol – InteligenŃa Artificială 186 do{ selectează k obiecte din O (la întâmplare sau folosind o funcŃie de selecŃie); do{ for ( fiecare obiect selectat ) folosind obiectul ca instanŃă pozitivă si celelalte obiecte selectate ca instanŃe negative, construieste o definiŃie generală a conceptului clasei construite în jurul obiectului selectat; clasifică toate obiectele din O folosind definiŃiile claselor obŃinute; for (fiecare definiŃie) while ( obiecte din celelalte clase nu sunt acoperite de această definiŃie ) generalizează definiŃia fiecărei clase; folosind o metodă numerică, caută elementul cel mai apropiat de centrul fiecărei k clase formate; } while (nu s-au format clase satisfăcătoare si numărul de încercări e mai mic decât un prag stabilit); } while (nu au fost obŃinute clase satifăcătoare); end 6 4 2 Structura cunostinŃelor taxonomice Algoritmii de învăŃare supervizată si metodele de clasificare prezentate mai sus definesc o clasă printr-o serie de atribute necesare si suficiente pentru apartenenŃa la acea clasă Desi eficientă în multe situaŃii, această definiŃie nu permite o clasificare flexibilă si structurată asa cum întâlnim în conceptele umane De exemplu, un om poate recunoaste un obiect ca fiind un exemplu mai bun al unei categorii, iar alt obiect un exemplu mai prost O vrabie este un exemplu mai bun al conceptului pasăre decât un pinguin Această diferenŃiere nu este permisă de definiŃia clasică a unei clase Teoria asemănării familiale (Wittgestein, 1953) dă o definiŃie mai apropiată de cea umană pentru o clasă Astfel, o clasă este definită de sistemul complex de similarităŃi între membrii ei, nu de o serie de atribute necesare si suficiente pentru apartenenŃa la acea clasă Această definiŃie permite, în extremis, ca membrii unei clase să nu aibă nici măcar o proprietate comună Un exemplu ar fi cel al clasei sport, ai cărei membri diferă prin numărul de jucători, regulile de joc, precum si alte proprietăŃi, totusi clasa este bine definită si neambiguă Clasificările umane mai diferă de cele formale si prin identificarea unor clase de bază mult mai relevante în clasificare decât generalizările sau specializările lor Conceptul autoturism este mai util în descrierea unui obiect decât generalizarea sa vehicul sau o specializare a sa cabrioletă În spatele unui astfel de concept de bază sunt mai multe informaŃii recunoscute de un clasificator uman, dar nu si de un sistem automat de clasificare Orice metodă ce îsi propune să identifice clase noi de obiecte trebuie să Ńină cont de mecanismul clasificării umane COBWEB (Fisher, 1987) este un algoritm de clasificare ce îsi propune să se apropie de modelul uman COBWEB recunoaste clase de bază si grade de apartenenŃă la clase COBWEB este un algoritm de învăŃare incrementală Cristea, IoniŃă, Pistol – InteligenŃa Artificială 187 ce defineste un număr optim de clase plecând de la un set de instanŃe neclasificate Clasele sunt reprezentate printr-un set de proprietăŃi, fiecare valoare posibilă a unei proprietăŃi având atasată probabilitatea P(pi=vij | ck) ca proprietatea pi să aibă valoarea vij pentru un obiect aparŃinând clasei ck Atunci când primeste o instanŃă nouă, COBWEB consideră utilitatea plasării instanŃei într-o clasă existentă sau a creării unei noi clase plecând de la acea instanŃă Criteriul folosit pentru evaluarea calitativă a unei clasificări se numeste utilitatea claselor (Gluck si Corter, 1985) Acest criteriu încearcă sa maximizeze atât probabilitatea ca obiectele din aceeasi categorie să aibă valori comune pentru o proprietate cât si probabilitatea ca obiecte din categorii diferite să aibă valori diferite ale aceleiasi proprietăŃi Utilitatea claselor se calculează pentru toate clasele ck , toate proprietăŃile pi si toate valorile posibile vij ale acelei proprietăŃi, ca: ΣkΣiΣj P(pi=vij) P(pi=vij | ck) P(ck | pi=vij) Maximizarea acestei sume înseamnă îmbunătăŃirea modului în care sunt construite clasele Algoritmul COBWEB este definit, pentru intrările Nod si InstanŃă, după cum urmează: Cobweb(Nod, InstanŃă) begin if (Nod este nod frunză) then begin crează doi fii ai nodului Nod, F1 si F2; iniŃializează probabilităŃile din F1 cu cele din Nod; iniŃializează probabilităŃile din F2 cu cele din InstanŃă; adaugă InstanŃă la Nod, modificând corespunzător probabiltăŃile; end; else begin adaugă InstanŃă la Nod, modificând corespunzător probabilităŃile; for ( fiecare descendent D al Nod) calculează utilitatea claselor obŃinute prin includerea InstanŃă în D; fie S1 scorul obŃinut de cel mai bun set de clase D1; fie S2 scorul obŃinut de al doilea mai bun set de clase D2; fie S3 scorul obŃinut dacă am plasa InstanŃă într- o clasă nouă; fie S4 scorul obŃinut dacă am reuni D1 si D2 într- un set de clase; fie S5 scorul obŃinut dacă am înlocui D1 cu fii săi; end; Cristea, IoniŃă, Pistol – InteligenŃa Artificială 188 if ( S1 este cel mai bun scor ) then Cobweb(D1, InstanŃă); else if ( S3 este cel mai bun scor ) then iniŃializează probabilităŃile din noua clasă cu cele din InstanŃă; else if ( S4 este cel mai bun scor ) then begin fie Dn setul de clase obŃinut prin reunirea D1 si D2; Cobweb(Dn, InstanŃă); end; else if ( S5 este cel mai bun scor ) then begin înlocuieste D1 cu fii săi; Cobweb (Nod, InstanŃă); end; end Algoritmul face o căutare în spaŃiul taxonomiilor posibile folosind utilitatea claselor pentru a evalua si selecta seturile posibile de clase IniŃial, pleacă cu o singură clasă cu probabilităŃile primei instanŃe primite Pentru fiecare instanŃă ulterioară, algoritmul parcurge arborele de clase (format iniŃial dintr-o singură clasă) si evaluează cel mai bun pas, dintre variantele: - adaugă o noua clasă formată din instanŃa nouă; - adaugă instanŃa nouă la clasa existentă la care se potriveste cel mai bine; - reuneste două clase existente în una singură si adaugă instanŃa la clasa rezultată; - înlocuieste o clasă existentă cu fiii ei si adaugă instanŃa la clasa rezultată la care se potriveste cel mai bine COBWEB este un algoritm eficient ce produce taxonomii cu un număr rezonabil de clase Prezintă tendinŃa de a grupa instanŃe în clase de bază, si datorită utilizării probabilităŃilor, acceptă noŃiunea de grad de apartenenŃă la o clasă 6 5 Concluzii ÎnvăŃarea automată tradiŃională se bazează pe un model conceptual raŃional al lumii fizice Pe baza acestui model s-au obŃinut structuri de reprezentare tot mai complexe, strategii de căutare mai eficiente si progrese semnificative atât în crearea unor sisteme ce simulează aspecte ale inteligenŃei biologice, cât si în înŃelegerea modului în care funcŃionează inteligenŃa umană Ideea unui model conceptual raŃional al lumii fizice se bazează însă pe tradiŃia filozofică raŃionalistă, care însă nu modelează si felul în care raŃionează inteligenŃa biologică InteligenŃa umană are la bază atât raŃionamente logice si stiinŃifice cât si raŃionamente empirice, esenŃiale mai ales în interpretarea necunoscutului Acest lucru a dus la crearea de noi metode de modelare a inteligenŃei, cum ar fi reŃelele neuronale si algoritmii genetici, sau la includerea unor raŃionamente empirice similare celor umane în algoritmi de învăŃare mai tradiŃionali Rezultatele Cristea, IoniŃă, Pistol – InteligenŃa Artificială 189 semnificative date de aplicarea acestor noi idei promit crearea unor sisteme tot mai inteligente, până la crearea primei inteligenŃe artificiale reale Probabil, prima inteligenŃă artificială veritabilă nu va fi creată de programatori umani, ci de un sistem artificial ce va învăŃa să fie inteligent observând instanŃele date de raŃionamentele umane Metodele învăŃării automate au devenit instrumente de bază în implementarea sistemelor complexe de inteligenŃă artificială Există numeroase centre de cercetare si conferinŃe anuale având ca principal domeniu dezvoltarea si evaluarea metodologiilor de învăŃare automată (vezi bibliografia) TendinŃa generală de a crea sisteme informatice tot mai independente si adaptabile face studiul ÎnvăŃării Automate unul dintre cele mai atractive domenii de cercetare în InteligenŃa Artificială Datorită limitărilor de spaŃiu, acest capitol prezintă doar o parte din algoritmii de învăŃare existenŃi, având ca scop doar atragerea interesului cititorului pentru documentare suplimentară în acest domeniu CerinŃe pentru studenŃi  Să fie familiarizaŃi cu cel puŃin două metode de învăŃare automată (dintre care una – ID3)  Să poate recunoaste cele mai indicate metode de învăŃare aplicabile unei probleme reale Probleme P6 1 DaŃi exemple de aplicaŃii pentru care învăŃarea automată nu poate fi aplicată în practică ExplicaŃi P6 2 DaŃi exemple de metode de învăŃarea automată pentru fiecare din categoriilei:  învăŃare supervizată, fără surse de cunoastere  învăŃare supervizată, cu surse de cunoastere  învăŃare nesupervizată P6 3 Un supervizor dă scoruri pentru stările unui joc de sah (situaŃia de pe tablă la un moment dat) Un program de învăŃare poate recunoaste mutările optime la un moment dat, alegând cea care duce la starea cu scor maximal Dacă însă programul de învăŃare nu ar dispune de exemplele de antrenament, cum ar putea învăŃa mutările optime? P6 4 Pentru construirea unui set de exemple de antrenament putem genera stări ce vor fi evaluate de un supervizor, urmând una din metodele următoare:  se generează la întâmplare o stare legală a pieselor de pe tablă;  se generează o stare plecând de la alta deja evaluată, din care se execută o mutare legală Care din cele două metode este mai eficientă (în sensul maximizării stărilor relevante pentru învăŃare – cu câstig maxim de informaŃie) P6 5 ConstruiŃi arborele ID3 pentru instanŃele de antrenament din tabela 6 2 Apoi repetaŃi pentru învăŃarea conceptului de umiditate, în loc de optim ski, utilizând atributele corespunzătoare din instanŃele de antrenament Cristea, IoniŃă, Pistol – InteligenŃa Artificială 190 Tabela 6 2 InstaŃe de antrenare pentru exerciŃiul 6 5 Zi prognoza cer temperatura umiditatea vântul Optim ski? 1 optimistă senin cald mare slab nu 2 optimistă înnourat cald mare puterninc nu 3 neutră înnourat cald mare slab da 4 proastă senin optim mare slab da 5 proastă senin frig normală slab da 6 proastă senin frig normală puterninc nu 7 neutră senin frig normală puterninc da 8 optimistă înnourat optim mare slab nu 9 optimistă senin frig normală slab da 10 proastă înnourat optim normal slab da 11 optimistă înnourat optim normală puterninc da 12 neutră senin optim mare puterninc da 13 neutră senin cald normală slab da 14 proastă înnourat optim mare puterninc nu P6 6 ConstruiŃi arborele ID3 pentru descrierea funcŃiei: (A^B)xor(CvD) P6 7 Dacă A1 si A2 sunt arbori de decizie si A2 îl conŃine pe A1, poate fi A2 rescris ca un arbore format din A1 si un alt arbore de decizie A3 atasat la una sau mai multe noduri terminale din A1? ExplicaŃi si daŃi exemple P6 8 DaŃi o soluŃie mai rapidă decât ID3 pentru învăŃarea automată a unor reguli de clasificare pentru instanŃele din tabela 6 2 P6 9 Ce poate fi învăŃat aplicând EBL pentru instanŃele de antrenament: Iasi (aproape (Botosani), aeroport (da), drum (Botosani)) Botosani (aproape (Iasi), aeroport (nu), drum (Iasi)) si baza de cunostinŃe: A: drum (B) ^ aproape (B) => condus (A, B) A: aeroport (da) => zbor (A, any) condus (A, B) ^ zbor (B, any) => zbor (A, any) P6 10 DescrieŃi o metodă de a reformula automat conceptul Ńintă pentru un algoritm de învăŃare supervizat în cazul insuficienŃei datelor de antrenament Exemple Cristea, IoniŃă, Pistol – InteligenŃa Artificială 191 Bibliografie Alpaydin E 2004 Introduction To Machine Learning, MIT Press Davis, R si Lenat, D B 1982 Knowledge-Based Systems in Artificial Intelligence New York: McGraw-Hill International Book Company, pp 1-225 DeJong G, Mooney R 1986 Explanation-based learning An alternative view, Machine Learning Fisher, D H 1987 Knowledge acquisition via incremental conceptual clustering Machine Learning 2: 139–172 Fisher, D H 1991 Concept Formation: Knowledge and Experience in Unsupervised Learning, Lawrence Erlbaum Gluck, M A si Corter, J E 1985 Information, uncertainty, and the utility of categories În Proceedings of the Seventh Annual Conference of the Cognitive Science Society, 283 287 Hillsdale, NJ: Lawrence Erlbaum Jebara T 2004 Machine Learning: discriminative and generative, Springer Langley, P 1987 A General Theory of Discrimination Learning In Production System Models of Learning and Development, Eds D Klahr, P Langley & R Neches, MIT Press Michalski R S si Stepp R E 1983 Learning from observation: Conceptual clustering În R S Michalski, J G Carbonell, and T M Mitchell, editors, Machine Learning: An AI Approach, volume 1, pages 331-364 Morgan Kaufmann Publishers Mill, J S 1843 Collected Works, Toronto: University of Toronto Press, 1963-89), XIII, 566 Mitchell T M 1997 Machine Learning, McGraw-Hill Mitchell, T M 1982 Generalization as search Artificial intelligence, March, 18(2), 203–226 Mitchell, T M 1978 Version spaces: An approach to concept learning PhD thesis, Department of Electrical Engineering, Stanford University Also Stanford CS reports STAN-CS-78-711, HPP- 79-2 Quinlan J R 1986 Induction of Decision Trees, Machine Learning Quinlan J R 1993 Programs for Machine Learning, Morgan Kaufmann Cristea, IoniŃă, Pistol – InteligenŃa Artificială 192 Quinlan, J R 1983 Learning Efficient Classification Procedures And Their Application To Chess End Games , Michalski, Ryszard S , J G Carbonell T M Mitchell, : Machine Learning - An Artifical Intelligence Approach, 463-482 Tioga Publishing Company Shannon C E 1948 A Mathematical Theory of Communication, Bell System Technical Journal, Vol 27, pp 379–423, 623–656 Shavlik J , Mooney R J , Towell G G 1991 Machine Learning, Morgan Kaufmann Utgoff P 1988 ID5: An incremental ID3 In Proceedings of the Fifth International Conference on Machine Learning, pages 107-120, Ann Arbor, MI, Morgan Kaufmann Valiant, L G 1984 A theory of the learnable Communications of the ACM 1984 pp1134-1142 Weiss S M , Kuliowski G 1993 Computational systems that learn: classification and prediction methods from statistics, neural nets, machine learning and expert systems, Morgan Kaufmann Widrow, B si Hoff, M E 1960 Adaptive switching circuits în IRE WESCON, pag 96-104, New York Convention Record Wittgestein L 1953 Philosophical Investigations, New york, Macmillan Site-uri utile: ColecŃie de site-uri despre Machine Learning: http://www aaai org/AITopics/html/machine html Cursuri disponibile on-line: http://www cs iastate edu/~honavar/Courses/cs673/machine-learningcourses html ConferinŃe si asociaŃii: European Conference on Machine Learning: http://www ecmlpkdd2007 org/ Knowledge Discovery and Data: http://www acm org/sigs/sigkdd/kdd/2007/ Association for the Advancement of Artificial Intelligence's National Conferene on Artificial Intelligence: http://www aaai org/Conferences/AAAI/aaai07 php